Tribunes

Consultant technique, Brocade France

Grâce au FAN (File Area Network), le monde fichier peut désormais bénéficier des avantages propres aux SAN (Storage Area Network)

PublicitéAu cours des années 90, les responsables informatiques se sont rendu compte que le modèle de stockage attaché DAS (Direct Attached System) n'offrait plus guère de possibilités d'évolution :l'exécution de tâches telles que la gestion, la sauvegarde ou la consolidation des données devenait tout simplement trop complexe et fastidieuse dans la plupart des environnements, puisque ces tâches devaient être exécutées au niveau du serveur. Véritable percée technologique, le réseau de stockage SAN (Storage Area Network) a été conçu pour surmonter les limitations du modèle DAS. En permettant aux serveurs d'accéder à leurs périphériques de stockage via un réseau Fibre Channel ou IP (Fibre Channel ou iSCSI), les SAN assurent l'abstraction d'informations telles que l'emplacement physique ou les paramètres du disque, tel que le système de fichiers. Avec la technologie SAN, les administrateurs de stockage ont la possibilité de centraliser la gestion et la consolidation de leurs données, ainsi que d'exécuter des tâches et fonctions telles que la sauvegarde, l'augmentation de la capacité et la haute disponibilité à partir d'un site central. Pour les administrateurs de stockage, si la virtualisation des volumes a constitué une évolution majeure, il subsiste néanmoins une dépendance entre le serveur (initiateur SAN) et le volume (ou LUN, numéros d'unité logique, périphérique SAN). Ainsi, ce modèle constitue la solution optimale pour les applications de hautes performances hébergées par des serveurs qui nécessitent une maîtrise directe du système de fichiers (bases de données transactionnelles par exemple) et doivent accéder à des données structurées (au niveau bloc). Aujourd'hui, les problèmes d'administration que rencontrent les entreprises au niveau des données non structurées sont similaires à ceux auxquels elles étaient confrontées dix ans auparavant avec le stockage au niveau bloc. Les systèmes de stockage de masse distribués représentent un véritable casse tête pour la plupart des entreprises en quête d'une technologie de gestion économique, évolutive et parée pour le futur. De nouvelles technologies sont actuellement développées pour résoudre ces problèmes. Le présent article décrit ces approches émergentes et montre comment le monde fichier peut à son tour bénéficier des avantages propres aux réseaux de stockage SAN. Avec des données non structurées, l'approche technique est différente : une couche de virtualisation doit être insérée entre le serveur (connecté à son périphérique de stockage) et le client (utilisateur ou serveur d'applications), dans la mesure où ni l'un ni l'autre ne peut accéder aux données du serveur au niveau bloc. Les deux protocoles standards couramment utilisés pour créer cette couche d'accès sont de type IP, à savoir CIFS (Common Internet File System) en environnement Windows et NFS (Network File System) pour les plates-formes Unix. Grâce à ces protocoles, les clients peuvent accéder aux fichiers (données non structurées) en envoyant des requêtes à la couche CIFS ou NFS d'un serveur de stockage. Principale différence entre un serveur de stockage (serveur SAN par exemple) et un périphérique NAS (Network Attached Storage), ce dernier utilise un système d'exploitation simplifié par rapport à Windows ou Unix, et dont la vocation majeure est de partager des fichiers via CIFS et NFS (même si certains systèmes NAS peuvent eux aussi fournir des volumes Fibre Channel ou iSCSI, auquel cas ils se comportent comme des périphériques de stockage SAN standard). En évoluant de la structure DAS à la structure SAN, les administrateurs de stockage ont pu virtualiser les volumes, se débarrassant ainsi de la dépendance physique entre le serveur et son stockage. L'utilisation d'une couche CIFS ou NFS sur des serveurs de stockage a permis à plusieurs clients finaux d'accéder à des données non structurées (fichiers), indépendamment de la couche de stockage physique. Mais au bout du compte, les utilisateurs finaux continuaient à accéder aux fichiers en requêtant un serveur spécifique : la dépendance physique s'était déplacée du lien physique serveur-stockage vers le lien physique client-serveur. Dans un environnement simple basé sur un serveur de fichiers unique, cette dépendance entre client et serveur de fichiers peut encore être gérée moyennant des tâches administratives raisonnables. Mais dans un environnement de stockage plus complexe comptant plusieurs serveurs de fichiers, les tâches administratives deviennent rapidement critiques. Le nombre de relations établies entre clients et serveurs de fichiers est au moins égal au nombre de serveurs de fichiers. Dans ce cas, les différentes tâches apparemment simples mais essentielles telles que déplacer des données entre serveurs de fichiers, leur assurer un haut niveau de disponibilité ou hiérarchiser l'architecture de stockage, auront un impact sur plusieurs milliers de relations entre clients et serveurs de fichiers. Pour gérer ces multiples relations avec une efficacité accrue tout en minimisant l'impact et les indisponibilités au niveau des clients finaux, il est nécessaire d'insérer une nouvelle couche de virtualisation : c'est précisément là que la technologie FAN entre en scène. Comme l'expliquent des cabinets d'analystes tels que le Taneja Group ou IDC, un réseau FAN (File Area Networking) est une association de technologies logicielles et matérielles dont la vocation est d'organiser, d'acheminer, d'administrer et d'assurer un accès cohérent aux données de fichiers disponibles dans le réseau de stockage. Voici les principaux avantages du modèle FAN : - Possibilité de gérer les données selon leur valeur pour l'entreprise, indépendamment de la plate-forme où elles sont physiquement stockées (c'est l'un des avantages des données de type fichier par rapport aux données de type bloc), - Possibilité de gérer et d'afficher des vues de fichier accessibles aux utilisateurs en fonction de leurs droits d'accès ou d'informations organisationnelles(projet,département, site, etc.), - Possibilité de migrer des données entre différentes plates-formes de stockage avec une transparence maximale et un impact minimum pour les utilisateurs, - Enfin, capacité d'envisager le partage des données comme une approche orientée service : le FAN est un moyen de permettre à chaque utilisateur d'accéder aux informations dont il a besoin aux différents niveaux de l'entreprise, indépendamment de leur emplacement ou de la plate-forme de stockage utilisée. Pour mieux comprendre le fonctionnement et les avantages des FAN, voici à présent les six couches qui composent un réseau FAN telles que les définit le Taneja Group, ainsi que les aspects importants qu'il importe de prendre en compte : Les périphériques de stockage constituent le niveau de base sur lequel reposent les autres couches FAN. Tout périphérique, qu'il s'agisse d'un serveur attaché à un SAN ou d'une appliance NAS - même un simple serveur avec disques internes - peut être considéré comme un périphérique de stockage FAN. Seule condition préalable, les clients doivent avoir la possibilité d'accéder aux ressources de fichiers partagées sur le périphérique de stockage, via le réseau. Seconde couche de ce modèle, le serveur de fichiers joue un rôle de passerelle en permettant aux utilisateurs d'accéder aux ressources fichiers du périphérique de stockage FAN via le réseau IP. Cette interface peut être intégrée au système de stockage FAN proprement dit (dans le cas d'un périphérique NAS par exemple) ou être superposée à un système d'exploitation serveur connecté à un système de stockage SAN (ou DAS). Tout périphérique de stockage FAN doit disposer d'une interface de serveur de fichiers reconnaissant les protocoles de partage de fichiers standard tels que CIFS (Windows) et NFS (Unix). Avec le modèle FAN, la combinaison de périphériques de stockage et d'interfaces de service de fichiers n'est pas visible pour le client de stockage, dans la mesure où les clients finaux accèdent essentiellement aux ressources fichiers du réseau FAN par l'intermédiaire de requêtes CIFS ou NFS. Toutefois, afin de proposer davantage de fonctions FAN avancées telles que le déplacement des données ou les règles d'archivage (gestion du cycle de vie des informations, par exemple), il peut s'avérer nécessaire de prendre en charge le système d'exploitation des périphériques de stockage (par exemple un système d'exploitation dédié au stockage sur des appliances NAS afin d'accroître les performances. En termes simples, les deux premières couches du modèle FAN (périphérique de stockage et périphérique de service de fichier) sont abstraites par rapport à la troisième couche décrite ci-dessous, à savoir la couche namespace. La couche namespace (système de vue logique) est le coeur du modèle FAN, car elle assure la virtualisation que requièrent les différentes fonctionnalités rendues possibles par ce modèle. On distingue plusieurs types de système de vue logique, depuis les namespaces partagés et non partagés jusqu'aux namespaces globaux, mais tous offrent les mêmes capacités à collecter, organiser et présenter les informations au niveau fichier à des clients finaux authentifiés, indépendamment de leur emplacement physique. Dans la mesure où la couche namespace représente la couche de base du modèle FAN, elle ne doit pas constituer un point de défaillance. C'est pourquoi le namespace global est le plus sûr : avec un système de vue logique global, la couche namespace est uniquement utilisée en tant que répertoire pour les ressources au niveau fichier ; elle fournit les indications physiques à ces ressources dès qu'un utilisateur demande un fichier. Son fonctionnement est proche de celui d'un serveur DNS : les demandes de ressources physiques s'effectuent par le biais d'alias, le système de vue logique établissant les connexions physiques entre le client final et la ressource physique. Dans une solution Hors Bande, cette approche évite que le global namespace devienne un goulet d'étranglement (du point de vue des entrées/sorties). Par ailleurs, les informations du namespace étant mises en cache au niveau client, celui-ci peut continuer à travailler sur les ressources fichier même en cas d'indisponibilité du système de vue logique. Malgré cette haute disponibilité intrinsèque, pour tirer pleinement parti des fonctionnalités FAN - telles que le déplacement des données entre périphériques de stockage avec un impact minimum sur les clients finaux -, la couche namespace globale doit bénéficier d'une haute disponibilité, en mettant par exemple les serveurs de namespace en cluster. La quatrième couche du modèle FAN, à savoir les services de gestion et de contrôle de fichier, représente la couche intelligente. Tous ces services sont interopérables avec le système de vue logique global : toute migration effectuée dans le modèle FAN actualise de façon dynamique les références obsolètes à l'aide de nouvelles références, de sorte que les utilisateurs sont redirigés vers les ressources fichier correctes. La réplication peut être associée à des règles de basculement ciblé et la solution FAN a la possibilité de superviser la validité de ces cibles à tout moment, ce qui automatise le processus de basculement en cas de défaillance de la cible primaire. Il est possible d'utiliser des règles de classification à base de critères pour mieux maîtriser le type de données stockées dans les périphériques de stockage ; la répartition des fichiers ainsi que le système de vue logique global, actualisent les données entre différents périphériques de stockage tout en minimisant l'impact des mouvements de données pour les utilisateurs finaux. Les systèmes de vue logique de type namespace peuvent être générés en associant les données relatives aux comptes utilisateurs et leurs droits d'accès aux ressources de stockage ; une fois automatisée par des règles de restauration et d'archivage, les règles d'archivage dans le modèle FAN permettent aux administrateurs de déployer un modèle de gestion hiérarchique du stockage (ILM) afin de mieux rentabiliser les investissements consacrés aux périphériques de stockage haut de gamme. Au coeur de tout déploiement FAN, se trouve, séparément du global namespace (tel que Windows DFS), une couche d'administration intelligente et efficace. Il s'agit par exemple d'un jeu d'outils d'administration, de gestion et de supervision FAN tel que les solutions FAN proposée par Brocade. Ces solutions permettent de configurer et de gérer le namespace de façon efficace tout en fournissant les services de gestion et de contrôle décrits comme la quatrième couche du modèle FAN. La cinquième couche concerne la connectivité. Comme vu précédemment, les utilisateurs du modèle FAN peuvent accéder aux informations relatives aux fichiers indépendamment de leur propre emplacement et de l'emplacement des données physiques proprement dites. Ceci signifie que les clients doivent avoir la possibilité d'accéder à leurs données en se connectant à l'infrastructure FAN par le biais d'une connexion à un réseau local ou distant (LAN ou WAN). L'utilisation de technologies telles que les services WAFS (Wide Area File Services) ou l'optimisation des transmissions de données de fichier sur réseau WAN minimisera les écarts de performances entre ces deux modes d'accès. Le principal objectif de la couche de connectivité pour le modèle FAN est de gérer des connexions réseau hétérogènes sans impacter les performances pour l'utilisateur. Cet élément doit être pris en compte si l'administrateur prévoit de déployer le modèle FAN dans un environnement distribué. Les clients finaux constituent la sixième couche du modèle FAN. Toute machine cliente pouvant accéder à ses données par l'intermédiaire du namespace FAN représente un client final FAN. En d'autres termes, toute plate-forme capable de demander des fichiers via le protocole CIFS et/ou NFS peut fonctionner avec un modèle FAN. Toutes ces couches du modèle FAN ont finalement le même objectif : assurer un accès unifié aux informations de fichiers. Toutes les tâches de gestion de stockage traditionnelles peuvent bénéficier du modèle FAN. La migration des données de fichiers entre périphériques de stockage locaux ou distants et la consolidation de données à partir de plusieurs périphériques de stockage de petites dimensions vers un référentiel de stockage central constituent des tâches courantes qui doivent être optimisées à l'aide de technologies de global namespace FAN. Il est essentiel, pour l'administrateur de stockage, de disposer d'une vue centralisant l'ensemble des ressources de données entre plusieurs sites afin d'optimiser l'utilisation des périphériques de stockage existants et de pouvoir les présenter aux utilisateurs finaux sous une forme logique et efficace. Les aspects sécurité et conformité sont également déterminants pour l'architecture FAN : la possibilité de montrer aux clients une vue logique uniquement basée sur les ressources accessibles, indépendamment de leur emplacement physique, représente un aspect intéressant pour toute infrastructure de stockage devant respecter les règles de conformité en vigueur. Déplacer les données moyennant un impact minimum sur la façon dont les utilisateurs peuvent y accéder est un élément déterminant du modèle FAN, notamment si la migration s'appuie sur des règles automatisées à base de critères. Si les données peuvent être déplacées tout en autorisant les utilisateurs à y accéder comme ils le faisaient précédemment, le concept de gestion hiérarchique du stockage (ILM) pourra être utilisé en toute transparence dans l'environnement de stockage. La gestion du cycle de vie des données peut être simplifiée par l'approche multi-couches du modèle FAN, ce qui permet aux administrateurs de stockage d'améliorer l'utilisation du stockage haut de gamme tout en minimisant les délais de sauvegarde sur les périphériques de stockage haute disponibilité les plus actifs. Une fois que les données ont été consolidées et rendues facilement accessibles via la couche namespace du modèle FAN, il est également important d'automatiser toutes les règles de continuité de service, de reprise sur incident et de basculement sur les périphériques de stockage consolidés. Pour ce faire, il convient de s'appuyer sur les règles de restauration et de sauvegarde et, dans la majorité des cas pour le FAN, sur les règles de réplication entre périphériques de stockage. Dès qu'une ressource de fichier est synchronisée entre plusieurs référentiels, une règle de reprise sur incident peut être associée pour interconnecter ces différents référentiels et, à terme, superviser et actualiser la validité des cibles namespace en cas de perte de l'une des ressources. Cet exemple souligne la nature décisive de la supervision et de l'actualisation de la couche namespace au sein du modèle FAN : lorsqu'une ressource est virtualisée, il est essentiel de cibler la plus pertinente. L'utilisation du modèle FAN permet de relever de nombreux défis relatifs à l'infrastructure de stockage. La virtualisation du stockage de fichiers et des services de contrôle et de gestion supplémentaires, ainsi que l'extension de cette fonctionnalité au-delà de limites géographiques, simplifient considérablement la tâche des administrateurs en assurant une évolutivité et une administration indépendantes de la couche de stockage physique et logique au niveau global. Pour les entreprises utilisant des systèmes de stockage de plus en plus complexes pour leurs données non structurées, le modèle FAN constitue un élément clé d'une structure d'administration parée pour le futur et se caractérisant par un coût total de possession raisonnable et une évolutivité optimale permettant de relever les futurs défis et de contribuer à la croissance.