Business

Quand la solution de haute disponibilité n'est pas à la hauteur des attentes.

Le 11 janvier, BP a été victime d'une panne électrique sur son serveur principal EMDC. Un incident qui rappelle que nul n'est à l'abri d'une coupure de courant, même lorsque l'on possède des onduleurs censés gérer ce type de situation.

PublicitéUn jeudi classé noir pour BP. Dans la nuit du 10 au 11 janvier, la compagnie pétrolière subit une panne de courant sur son serveur principal basé à Londres. Bon nombre de salariés européens se retrouvent alors privés d'Internet et n'ont plus accès à leurs disques ni à leurs serveurs partagés. Cette panne va se poursuivre dans la soirée et ce n'est qu'à environ 18 heures (heure française) que tout va finalement rentrer dans l'ordre. Selon un porte-parole de BP France, il s'agit du système électrique primaire de l'hébergeur Global Switch qui n'a pas fonctionné. Comble de l'ironie lorsque l'on sait que le métier de Global Switch consiste à fournir des locaux informatisés sécurisés dotés d'installations électriques et climatiques de haute disponibilité. Bref, un dysfonctionnement dont les conséquences peuvent se révéler très lourdes pour les clients touchés. Surtout si la panne tend à perdurer, obligeant les salariés à recourir aux bonnes vieilles méthodes, le papier et le fax. A qui la faute ? Erreur humaine ou problème technique ? BP espère bien obtenir des réponses à ses questions et réclamer des comptes à Global Switch, son hébergeur depuis quelques années. Des pannes électriques de plus en plus fréquentes Selon une étude menée par le Clusif, près de la moitié des entreprises françaises ont connu des pertes de services liées à des coupures d'électricité en 2005. Et l'on se souvient de la panne de New York en 2003 ou plus récemment celle de novembre dernier qui a plongé dans le noir une partie de l'Hexagone, de l'Italie, de l'Allemagne et la Grande-Bretagne. Or, plusieurs facteurs laissent présager que cela n'ira pas en s'arrangeant. Les besoins électriques ne cessent de croître et certaines infrastructures électriques deviennent obsolètes. Si personne n'est à l'abri d'un incident sur son système d'information, BP semblait pourtant avoir pris les précautions nécessaires pour protéger ses infrastructures informatiques contre une éventuelle panne électrique en faisant héberger ses serveurs dans un centre de données équipé pour faire face à ce genre d'incidents. Mais le risque zéro n'existe pas. D'autres centres de données en ont fait les frais. Cet été, notre confrère britannique Computer Weekly a recensé deux autres pannes similaires. A commencer par l'hébergeur Telehouse, basé à Londres, qui a subi une interruption de services le 17 aožt à cause d'un problème électrique. Même cas de figure pour le centre de données de CSC. Le 30 juillet, un travail de maintenance sur un onduleur provoque un court-circuit et conduit à un arrêt de services d'une durée de quarante-cinq minutes. Etre vigilant sur le niveau de service Plusieurs raisons peuvent être à l'origine de ces incidents électriques. Mais pour celui qui a touché la compagnie pétrolière, le mystère reste entier. " Normalement, lors d'une panne de courant, un onduleur de Global Switch doit reprendre le relais, déclare le porte-parole de BP France. Or, cet onduleur n'a pas fonctionné. " Chez Global Switch, personne n'a souhaité commenter l'incident. Plusieurs hypothèses peuvent être émises. Selon nos sources, l'équipement de Global Switch ne serait pas en cause. Il se pourrait qu'il s'agisse d'un point de défaillance unique (sans redondance) sur les équipements électriques. Pour réduire cette part de risque, le client doit se prémunir de plusieurs façons. D'une part, il doit être vigilant sur le contrat qui le lie à son prestataire, et d'autre part, il doit faire attention aux services proposés par les centres de données. Parmi les plus importants figure l'engagement de niveau de service ou Service Level Agreement (SLA) pour l'électricité et le refroidissement. C'est un document permettant de définir le niveau de performances attendu par le client et l'étendue des garanties apportées par le prestataire. L'autre point important concerne les programmes de maintenance préventive planifiée (PPM) et la présence d'ingénieurs sur site 24 heures sur 24. En outre, il est nécessaire de disposer d'une quantité de combustible sur site assurant une alimentation pendant plusieurs jours ainsi que des contrats de ravitaillement prioritaire. Enfin, dernier élément et pas des moindres, il convient de s'assurer que les systèmes de sécurité ne seront pas endommagés en cas de panne.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis

    La question du moment
    Proposez-vous des portails IT en self-service pour permettre aux utilisateurs de résoudre seuls des problèmes courants ?