Mise en place d’un environnement de stockage de
données en réseau
Présentation des data center
L’expression data center ou centre de traitement de données n’a pas une définition unanime dans le 356 domaine des Tics. 357 En effet si pour certains, un data center est une salle ou un bâtiment où l’on entrepose les serveurs 358 d’une entreprise sous surveillance, pour d’autres c’est l’environnement qui part du local aux 359 matériels et logiciels permettant d’assurer la sécurité, la garantie, la disponibilité 24h sur 24h des 360 données de particuliers et/ou d’entreprises. 361 La définition que nous retenons présente le data center ou centre de traitement de données comme 362 étant l’ensemble formé par le local et la plateforme techniques assurant le traitement et 363 l’hébergement de plusieurs types de données et applications informatiques conformément aux 364 normes strictes préétablies (électricité, température, humidité, protection incendie, communications, 365 accessibilité, sécurité etc.). C’est donc un espace aménagé et sécurisé pour abriter, traiter et protéger 366 les données. Il peut éventuellement être un centre de backup (centre de sauvegarde), un centre de 367 fall-back (centre de secours) ou un centre de documentation électronique pour les applications 368 existantes ou à venir. Il doit être discret, tout en étant accessible et sécurisé. 369 Le concept de data center a évolué et est devenu aujourd’hui un modèle commercial à part entière. 0 Certaines sociétés de services conçoivent des offres de pointe à l’échelle mondiale, proposant de 1 stocker les données sensibles d’entreprises ou d’organisations de manière redondante et délocalisée. Cet aspect commercial a considérablement amélioré leur politique de mise en œuvre en incluant des mesures de sécurité très efficaces mais toutefois très coûteuses afin de garantir la fiabilité et la sécurité des données. Tenant compte des coûts engendrés par une indisponibilité de données, les sociétés de service mettent tout en œuvre pour mettre en place des data center à la pointe de la technologie. Mais ces derniers se doivent de respecter les normes et contraintes fixées par les instances nationales et 8 internationales.
Architecture des espaces dans un data center
Selon le troisième chapitre de la norme ANSI/TIA 942-2005, l’espace dans le site du data center peut être séparé en neuf parties dont sept internes au data center et deux en dehors du data center. Le schéma ci-dessous illustre notre argumentation. Figure 2:Répartition des espaces dans un data center 4Selon la norme, le data center en lui-même est composé des parties suivantes : Une salle des équipements de télécommunication servant le data center 7 Cet espace permet d’interconnecter toutes les différentes salles du data center et tous les équipements réseaux. Il permet aussi d’assurer la communication interne au data center. Une salle d’administration C’est l’espace de surveillance des équipements, des applications et des données du data center. C’est dans la salle d’administration que l’on exploite les différents logiciels de surveillance et les services du data center. Une salle d’opération 6 Elle permet la surveillance des accès physiques au data center. C’est le lieu où l’on examine les différents fichiers de vidéosurveillance en cas d’intrusion. Les personnes travaillant dans cette salle 8 sont alertées en cas de détection d’incendies et prennent les premières mesures de sécurité. Une salle technique et électrique Sujet : La salle technique et électrique permet d’installer et de contrôler tous les systèmes électriques et mécaniques. On y trouve les différents tableaux électriques, les générateurs, les systèmes de climatisation… Un entrepôt et quai de chargement L’entrepôt permet de conserver tous les matériels non encore utilisés dans le data center ainsi que les 8 différents équipements de sauvegardes des données. Le quai de chargement sert d’interface entre le 9 site du data center et le monde extérieur en matière de logistique. Elle permet le stockage et facilite 420 le transport des matériels à l’intérieur comme à l’extérieur du site.
Une salle machine
C’est le lieu destiné à la disposition des différents racks, des systèmes de refroidissement et d’alimentation du data center. Cet espace est composé de : – Racks et compartiments : Les racks servent à stocker plusieurs machines (serveurs physiques, routeurs, commutateurs…) sur une même surface en les empilant les unes sur les autres. De ce fait on peut avoir jusqu’à 48 machines de 1U (1,75’’=4,445 cm) sur une surface de 1 mètre carré. Les 428 racks assurent entre autre la sécurité des appareils et donnent une beauté et une clarté à la salle. – Systèmes de climatisation : Les data center sont équipés de systèmes de climatisation qui permettent de maintenir leur température constante et conforme aux spécifications thermiques de la norme. – Systèmes de détection et d’extinction d’incendie : Dans les data center, on trouve des extincteurs qui permettent de lutter contre les incendies éventuels. En outre, il est prévu, pour ne pas arriver aux incendies, des méthodes de détection de fumée et d’incendie. Une salle d’entrée C’est la salle des différents contrôles physiques (badge, carte magnétique, empreinte digitale…). Les différentes salles citées constituent l’espace du data center. A l’extérieur du data center proprement dit on peut retrouver des bureaux et une salle de télécommunication innervant ces bureaux. Ces deux espaces ont respectivement pour fonction: Espace de bureaux C’est l’espace qui regroupe les différents bureaux qui traitent des sujets n’étant pas en rapport avec les services du data center (comptabilité, ressources humaines…). Une salle des équipements de télécommunication servant le data center Cet endroit est l’espace qui permet d’interconnecter tous les différents bureaux extérieurs au data center.
Architecture réseau des data center
L’architecture d’un data center classique comprend, une salle d’entrée, une ou plusieurs salles de télécommunication, une aire de distribution principale, plusieurs aires de distribution horizontale reliées à des aires de distribution d’équipement. L’architecture générale ci-après montre les différents câblages au niveau d’un data center. Figure 3: Architecture classique du réseau dans un data center LAN : Local Area Network est un réseau local situé dans une zone réduite comme une salle, un bâtiment, un immeuble ou un bloc d’immeubles etc. AN : Storage Area Network est un réseau de grande capacité reliant des serveurs mettant à 468 disposition d’importants espaces de stockage de données Commutateur KVM : Keyboard Video Mouse permet de connecter un seul écran-clavier-souris sur plusieurs ordinateurs; il favorise la suppression des écrans, claviers, souris inutiles tout en facilitant l’accessibilité et le partage des accès serveurs, libère de la place dans les bureaux et salles informatiques et rationalise l’organisation physique des différents équipements.
Enjeux de l’implantation des data center
Les enjeux de l’implantation d’un Datacenter sont d’ordre technique, économique, politique et social. D’un point de vue technique, l’enjeu de l’implantation et de l’utilisation d’un data center est visible en trois points essentiels: La disponibilité et la fiabilité des données : La disponibilité et la fiabilité des données sont par essence quelques un des éléments pour lesquels les data center ont été conçus avec des équipements redondants. C’est-à-dire que même pendant la maintenance de certains serveurs, d’autres en assurent la relève sans difficulté ce qui assure une continuité des services. Par exemple pour un data center en 485 Tier IV, le temps d’indisponibilité annuel est de 48mn, ce qui prouve le niveau de disponibilité dans 486 un data center. La sécurité : Les data center utilisent les meilleures méthodes de sécurité tant au niveau des 488 données qu’au niveau physique (des matériels et personnes). En prévoyant des mesures d’une part 489 contre les menaces numériques que sont : la criminalité informatique, la cybercriminalité, l’ingénierie sociale, ils assurent d’autre part une protection contre les catastrophes et intempéries, les pannes informatiques, les erreurs humaines… De plus, Ils assurent le premier niveau de sécurité (la sécurité physique) qui concerne tout l’environnement du système d’information (sécurité d’accès, climatisation, électricité régulée, sécurité incendie, protection contre les inondations, …) par des moyens bien étudiés et bien conçus. 495 La qualité de service : Le recours à un data center apporte une meilleure qualité de service à une 496 entreprise. A priori, il ne paraît pas logique de placer ses données confidentielles à l’extérieur de sa 497 structure administrative. Cependant, la plupart des responsables admettent aujourd’hui que leurs 498 données sont plus en sécurité externalisées (hébergées auprès de spécialistes) que conservées en interne. De plus les data center sont des bâtiments innervés de fibres optiques donc joignables à très grande vitesse. Les clients de ces dits centres auront accès à leurs données et aux services proposés comme si ils leur étaient locaux. La qualité de service se fera ressentir aussi par l’amélioration de la réactivité aux demandes des clients. En effet, les entreprises ne se souciant plus de leurs données étant en sécurité dans le data center vont donc répondre plus rapidement et facilement aux attentes de leurs différents clients. D’un point de vue économique, les enjeux sont à deux niveaux; d’une part il y a des enjeux pour les clients qui hébergent leurs données ou leur système informatique dans un data center et d’autre part des enjeux pour le détenteur du dit data center. Pour les clients Les clients faisant appel aux services du data center gagnent à plusieurs niveaux : – L’externalisation : Héberger en interne son système d’information de façon sécurisée requiert des niveaux d’investissement extrêmement élevés. L’externalisation ou outsourcing est le fait pour un prestataire de data center de prendre en son compte le risque de réaliser ces investissements lourds et nécessaires afin de garantir la sécurité des systèmes d’information de ses clients. Ainsi, le client gagne puisque les coûts d’hébergement de son système d’information sont insignifiants face aux coûts qu’il aurait engrangés pour la sécurisation de celui-ci en interne. – Réduction du nombre de serveurs au sein des entreprises clientes : Tout le système d’information des entreprises étant externalisé dans les data center, le nombre de serveurs utiles pour le fonctionnement de ces entreprises sera donc réduit. Ainsi ces entreprises économisent le coût d’achat et d’administration des serveurs. – Réduction de la consommation d’énergie : Comme expliqué précédemment, le recours au data 3 center réduit le nombre de serveurs au sein des entreprises. En effet, les serveurs étant très gourmands en consommation d’énergie et nécessitant un refroidissement permanant à cause de la chaleur qu’ils dégagent, la réduction de leur nombre affecte considérablement la consommation d’énergie. Pour le détenteur du data center La filière du data center est devenu une filière commerciale à part entière. Les différentes recettes engendrées par l’hébergement seul des systèmes d’information des entreprises clientes sont déjà intéressantes. Mais les recettes apportées et pressenties par les services tels que le Cloud computing sont énormes et permettraient aux détenteurs des data center de tirer pleinement profit de leur infrastructure. En effet, vue l’évolution du monde les plus grandes richesses seront de type 534 numérique et les plus grands riches seront les détenteurs de ces données numériques. On parle même 535 de la notion d’économie numérique. 536 5 D’un point de vue social, on peut dire qu’au-delà des évolutions techniques, technologiques et des 5 aspects commerciaux, les objectifs des décideurs d’un pays vis-à-vis des investissements réalisés 5 pour mettre en place un data center sont nombreux. Pour les pays les moins avancés, l’implantation 5 de data center revêt des enjeux et des possibilités innombrables. Il s’agit premièrement d’assurer la 5 sécurité du patrimoine informationnel national et d’offrir aux partenaires et clients des infrastructures appropriées pour l’hébergement et le traitement de leurs données. En outre, le centre de traitement des données, en privilégiant la mutualisation des ressources informatiques, offre également un espace d’hébergement aux petites et moyennes entreprises et favorise ainsi l’émergence d’une plus large expertise locale et une visibilité nationale et internationale de cette expertise. De plus, elle permettrait de réduire la fracture numérique parce qu’elle nécessite la mise en place de liaisons par fibre optique au moins vers les opérateurs internet et vers les entreprises. Les particuliers chez eux auront droits à de plus grands débits internet et un meilleur accès à l’information. Ceci peut ouvrir des portes à beaucoup d’autres évolutions telles la numérisation et le stockage de l’état civil national 550 accompagnés d’applications accessibles à toutes les mairies pour l’impression d’extrait de naissance 551 ou d’autres papiers du genre. Au niveau politique, l’avantage de l’implantation d’un data center se fait ressentir par: – La réduction du chômage : La mise en place d’un data center nécessite une main d’œuvre importante. Depuis la conception du projet en passant par l’installation des matériels jusqu’à l’administration proprement dite de l’infrastructure, plusieurs personnes qualifiées sont sollicitées ce qui peut aider à réduire considérablement le chômage. – Un challenge technologique : Frôlant la prouesse technologique, la mise en place d’un data center respectant les spécifications techniques se révèle être un vrai challenge et permettrait aux pays les moins avancés de s’aligner à l’évolution technologique du monde et de mieux participer à l’échange 563 d’information au niveau mondial. 564 565 566 L’état de l’art sur les data center a montré dans un premier temps les généralités sur les data center 567 par la présentation de ceux-ci et de leurs différentes architectures. Dans un second temps il a abordé 568 l’importance de leur implantation pour les pays les moins avancés, les entreprises clientes et les 569 détenteurs de data center. Après cette présentation des généralités sur les data center, il est important 570 de passer à l’état de l’art sur le stockage de données en réseau.
ETAT DE L’ART SUR LE STOCKAGE EN RESEAU
Le SAN (Storage Area Network)
Le SAN (Storage Area Network) est un réseau dédié au stockage relié aux réseaux du data center. 576 C’est un réseau totalement indépendant du réseau classique LAN. En effet le SAN est un réseau de grande capacité permettant de connecter l’ensemble des unités de stockages et des serveurs. Il s’agit d’un réseau physique constitué de fibres optiques afin d’atteindre une bande passante de plus de GB/S et peut être étendu en multipliant les liens d’accès. La capacité d’un SAN peut être étendue de 580 manière quasi-illimitée et atteindre des centaines, voire des milliers de téraoctets. Figure 4 : Topologie SAN Ses fonctions comprennent le stockage proprement dit, la sauvegarde, la réplication, la sécurisation, 587 le partage et l’administration des données. Son unité de base est le bloc de données ce qui consiste à 588 effectuer des transferts de données par paquets de 512 octets généralement. Avec le mode bloc, des 589 commandes multiples d’Entrée/Sortie peuvent être passée ce qui réduit les interruptions CPU. 590 Au milieu des années quatre-vingt-dix, le SAN reposait exclusivement sur des liens Fibre Channel, 591 une technologie de transport série à haut débit et longue distance. Aujourd’hui, il exploite souvent en 592 combinaison les technologies de transport Fibre Channel, Gigabit Ethernet et ATM, et les protocoles 593 FCP, IP et iSCSI. 594 Le SAN présente des avantages tels que la performance d’accès aux données, la disponibilité, la 595 fiabilité, la stabilité, la sécurité des données et enfin, l’économie des personnes destinées à la gestion 596 journalière. Les forces d’un SAN se situent à trois niveaux : Le SAN est un réseau spécialisé. Il est affecté à la connexion des unités de stockage, tels que 601 disques, librairies de backup, robots de backup,… aux serveurs. Ce qui permet un accès des 602 utilisateurs aux données sans charger le réseau du data center. En spécialisant les réseaux, les 603 machines sont reliées entre elles par un réseau réservé à cette fin. Dès lors l’utilisateur (les 604 serveurs) dispose d’un réseau libéré donc plus performant. Effet immédiat : le temps de réponse 605 s’améliore nettement. Sujet : Mise en place d’un environnement de stockage de données en réseau Une architecture traditionnelle de server-attached storage demande le shutdown du serveur pour 607 tout ajout de capacité de stockage. Le SAN, quant à lui, permet d’ajouter des unités de stockage 608 sans interruption de service. Dès lors son utilisation est justifiée dans le cadre d’applications qui connaissent une forte dynamique de croissance. Le SAN autorise la centralisation des backups ce qui aide à garantir l’intégrité et la sécurité des données. Cependant ses principaux inconvénients sont : Son coût. En effet, il nécessite un réseau spécifique à très haut débit très coûteux 616 généralement à base de Fiber Channel, ATM ou Gi Gigabit Ethernet. Il ne peut pas se baser sur un réseau déjà existant car il provoquera vraisemblablement de très importants engorgements perdants de ce fait tous ses avantages.
Les Composants physiques d’un SAN
Les performances d’un SAN dépendent également des différents équipements réseaux qui le constituent; ils ne sont pas tous indispensables, mais recommandés. Nous allons décrire dans cette section les unités de stockage, les unités d’interconnexion, les supports de transmission et les serveurs.
Les périphériques de stockage
Un périphérique de stockage est un composant dans lequel une grande quantité d’information peut 630 être enregistrée sous forme de bits. Ces périphériques sont en deux catégories, les systèmes de 631 disques et les unités de bande magnétique.
Les systèmes de disque
Un système de disque est un périphérique (baie) comportant un nombre de disques physiques placés 636 les uns près des autres. Les baies de stockage (Storage Array en anglais) sont constituées d’un 6 ensemble de disques gérés par des contrôleurs, avec une mémoire cache pour améliorer le temps de 6 réponse d’entrée/sortie. Les baies intègrent des fonctions embarquées, comme la création de prise 6 d’image (Snapshot), de miroir (clone) local ou distant (réplication). La suite logicielle est basée sur un système d’exploitation embarqué (Windows, Linux ou propriétaire). Au regard du contenu matériel et logiciel, une baie de stockage peut être considérée comme un serveur spécialisé et totalement intégré, dont l’objectif principal est de servir des espaces sécurisés de stockage vers des serveurs. Selon la technologie supportée par ce système, on parlera d’un système de disques JBOD ou RAID. 645 JBOD : Just a Bunch of Disks c’est-à-dire, ensemble de disques durs, sans configuration 646 particulière, placés les uns à côté des autres. Dans ce cas, l’unité de contrôle fournit 647 uniquement des fonctions de lecture/écriture des données sur les disques. 648 RAID : dans cet autre cas, l’unité de contrôle fournit des fonctionnalités additionnelles qui permettent d’utiliser chaque disque de manière à garantir une meilleure tolérance aux erreurs et des performances plus élevées
AVANT PROPOS |