Proposé par Huawei

Nouvelles applications, nouvelles données et enjeux de résilience : l'industrie du stockage doit se réinventer

La progression fulgurante des technologies numériques et de l'IA conduit des milliers d'entreprises de tous secteurs à accélérer leur transformation digitale. Dans ce contexte, les solutions de stockage des données subissent une métamorphose profonde et offrent d'immenses opportunités de développement.

Nouvelles applications, nouvelles données et enjeux de résilience : l'industrie du stockage doit se réinventer

De nouvelles applications en plein essor

Le recours croissant à de nouvelles applications d’intelligence artificielle est sans doute le phénomène le plus marquant de ces derniers mois. Plus de 56% des entreprises déploient désormais des applications d'intelligence artificielle dans leurs systèmes de production et de prise de décision. En parallèle, de plus en plus d'applications nativement conçues pour le cloud font leur entrée dans les datacenters des entreprises.

De nouvelles données en forte croissance

Autre changement majeur : l’explosion du volume de données à traiter va de pair avec l’augmentation des formats non structurés : 80% des données nouvellement créées sont des données non structurées qui nécessitent des solutions de stockage adaptées.

De nouveaux enjeux de résilience

Enfin, l’augmentation des menaces informatiques et l’omniprésence des ransomwares n’ont échappé à personne. Les rançongiciels mutent rapidement, augmentant de 98 % d'une année sur l'autre. 14,1% des données infectées par un ransomware sont irrémédiablement endommagées suite à une attaque.

Pour répondre à ces besoins, le secteur du stockage des données doit être en mesure de proposer des technologies et des produits innovants



Pour les applications modernes, le stockage doit adopter de nouveaux paradigmes afin d'accélérer l'acquisition de données à valeur

Prenons l’exemple des nouvelles applications pour les véhicules autonomes. Différents types de données entrent en jeu dans le processus d’entraînement de l’IA : panneaux de signalisation, piétons, conditions météorologiques, distances entre les véhicules, vitesse…

L’ensemble de ces données doivent être stockées et analysées, le plus souvent en temps réel. La capacité des grands modèles d'IA est utilisée pour obtenir des données de modèle de base et de haut niveau. Dans le cas des grands modèles d'IA, la séquence temporelle des données, la convolution des données et le regroupement des données augmentent la dépendance vis- à-vis des performances, de la fiabilité et de la sécurité du stockage des données.

Le modèle de coopération entre le stockage des données et les applications de données est en cours de reconstruction. Tout l’enjeu est d’exploiter les capacités de traitement des données proches du stockage, en prenant en compte les nouveaux formats de données, le cache partagé haute performance et une agrégation du trafic réseau, pour permettre aux grands modèles de données d'IA de fonctionner avec des réseaux neuronaux profonds, des réseaux neuronaux convolutifs et des réseaux neuronaux récurrents. La perception des données et la prise de décision sont ainsi simplifiées, l'efficacité accrue, la recherche scientifique facilitée et la formation des systèmes dans le domaine des véhicules autonomes accélérée.

En outre, le stockage des données doit s'adapter à diverses applications "cloud-native". De plus en plus de nouvelles applications passent des cloud ublics aux centres de données sur site des entreprises. Les infrastructures traditionnelles des centres de données ne disposent pas des technologies de conteneurs et ne peuvent pas supporter ces applications émergentes. Par conséquent, un changement doit être initié pour que les solutions de stockage des données prennent en charge l'écosystème des conteneurs et s'adaptent au déploiement des applications émergentes.

Le système de stockage doit être capable d'intégrer l'interface standard CSI (Container Storage Interface) des conteneurs ainsi que l'interface CDR (Container Data Redundancy) des conteneurs étendus pour prendre en charge l'écosystème conteneurisé. Lorsque les applications de la couche supérieure sont reconstruites vers le cloud, le système de stockage peut interconnecter de manière transparente différents centres de données et développer des capacités de persistance des données. Huawei utilise la première solution de stockage de conteneurs actif-actif de l'industrie pour atteindre un RPO (Recovery Point Objective) de zéro et un RTO (Recovery Time Objective) inférieur à 90 secondes. Actuellement, plus de 80 entreprises évoluant dans des secteurs stratégiques dans le monde ont choisi la solution de stockage de conteneurs Huawei.

Le stockage, un levier pour contourner les problèmes de silos et offrir une vue unifiée de la donnée

L’exemple de China Mobile est révélateur. Le groupe possède un système de données très volumineux, avec des données générées à travers tout le pays et stockées localement. Pour exploiter davantage la valeur de ces données, China Mobile devait s’appuyer sur un système de stockage capable d’unifier les données, en les stockant sur un même dispositif.

En plus de mettre en œuvre une vue globale et unifiée des données, les systèmes de stockage doivent permettre une planification entre les systèmes, les régions et les cloud. Huawei utilise le Global File System (GFS) pour faciliter l'accès aux données entre différents cloud, et même pour permettre l'accès aux données de stockage provenant de fournisseurs différents. Il permet également l'accès aux données stockées entre les cloud privés et publics. Peu importe votre localisation ou le cloud que vous exploitez, vous pouvez accéder à une vue globale des données et les utiliser de manière transparente à l'échelle mondiale.

Faire face à l’augmentation des données non structurées

La quantité de données non structurées augmente chaque jour. Bien exploitées, ces données non structurées contribuent à l'amélioration des processus décisionnels et de production.

Mais cela implique de revoir à la hausse les performances offertes par le stockage distribué.

Pour atteindre cet objectif, nous avons besoin d'une architecture distribuée offrant des performances globales élevées plutôt que de concentrer uniquement nos efforts sur les performances en matière de sauvegarde et d’archivage. Nous pensons qu’il est nécessaire de multiplier la bande passante de stockage par 100 et d'augmenter la vitesse de lecture/écriture en IOPS (Input/Output Operations Per Second) par 1000.

Prenons l'exemple de l'hôpital Ruijin à Shanghai, en Chine. Au sein de cet établissement, les pathologistes lisent plus de 1000 fichiers d’images médicales par seconde à des fins de comparaison, d’analyse et de modélisation. Le stockage distribué de Huawei constitue une solution rentable pour gérer cette quantité croissante de données non structurées. Il permet de gérer des volumes de données massifs sans augmenter considérablement le budget. Le stockage de données de Huawei utilise de nouvelles technologies, des algorithmes de codage et de compression de données avancés à la fois au niveau logiciel et matériel, ce qui permet d'augmenter la densité du système dans son ensemble et d'augmenter la capacité de stockage de 30% par unité de volume.

Le stockage, une arme au service de la nouvelle résilience du SI

Au-delà des catastrophes naturelles et des incidents touchant les équipements physiques, nous constatons une augmentation flagrante du facteur humain dans les dommages qui touchent les données. Pour endiguer le phénomène, les systèmes de stockage doivent intégrer davantage de fonctionnalités de sécurité afin d’offrir des capacités de défense proactive. Nous savons que l'infrastructure des données informatiques est une infrastructure en couches, elle doit donc également être protégée par des couches, comprenant la couche d'application, la couche réseau et celle en périphérie.

C’est désormais une certitude : les solutions de stockage doivent se doter capacités de sécurité des données intégrées. Elles constitueront la dernière ligne de défense face à des attaques de plus en plus nombreuses et sophistiquées.

Pour jouer ce rôle de dernier rempart et garantir la sécurité des données critiques, le stockage de données Huawei intègre une détection précise et des fonctionnalités telles que la WORM (Write Once, Read Many), le chiffrement des données, la prise de clichés sécurisée et la séparation d'air (AirGap). Cela garantit la non-compromission des systèmes, évite toute modification involontaire des données et assure la restauration des services grâce à une dernière ligne de défense efficace.

Vous pouvez déployer des moyens colossaux, construire une véritable forteresse, désigner une équipe de soldats pour patrouiller, ériger des barrières toujours plus solides, vous aurez toujours besoin d’un coffre-fort pour sécuriser vos données !

Nouvelles applications, nouvelles données, nouvelles approches de la sécurité : l’industrie du stockage doit nécessairement évoluer

Depuis sa création dans les années 1990, le stockage SAN – de par sa fiabilité et ses performances – a toujours été le premier choix pour les applications de base de données.

Vers les années 2000, l'émergence d'Internet a permis au stockage de pénétrer diverses industries. Par la suite, le stockage NAS a fait son apparition pour garantir un stockage fiable et un partage efficace des données documentaires. En 2010, le concept de "cloud computing", représenté par les machines virtuelles (VM) est apparu. Le regroupement des ressources est devenu l'architecture dominante de la construction des datacenters. Un système de stockage unifié intégrant SAN et NAS peut prendre en charge diverses applications de machines virtuelles. Vers 2015, le stockage tout-flash a commencé à remplacer massivement le stockage HDD grâce à ses avantages en termes de performances élevées, de fiabilité et d'économie d'énergie, répondant à l'augmentation décuplée des performances des applications à l'ère mobile.



Les nouvelles applications, les nouvelles données et la nouvelle approche de la sécurité rendront l'industrie du stockage hautement évolutive. La capacité totale de stockage mise à disposition par les cinq principaux fournisseurs de stockage externe dans le monde en 2022 est trois fois supérieure à celle de 2012. En 2032, cette capacité sera multipliée par 10, dépassant les 100 EB, nous faisant entrer dans l'ère des YB (yottaoctets).

Partager cet article

Abonnez-vous à la newsletter CIO

Recevez notre newsletter tous les lundis et jeudis