Stratégie

Savoir réagir à un incident majeur de production

Savoir réagir à un incident majeur de production

En juin 2013, un incident a provoqué un arrêt du coeur SAP du système d'information financière de l'Etat, Chorus. Signalé dans la presse, l'incident devient une crise. Régine Diyani, directrice de l'AIFE (en photo), et Emmanuel Spinat, délégué à la maintenance et à la supervision opérationnelle, reviennent pour nous sur la résolution du problème. Avec sang-froid.

PublicitéCIO : Le mercredi 19 juin 2013, le coeur SAP de Chorus a subi un arrêt non-programmé. Quelle a été la chronologie exacte de l'incident ?

Emmanuel Spinat : A 10h20, il y a en effet eu un incident sur le site d'hébergement Bull de Trelazé près d'Angers. Au départ, nous avons constaté une difficulté d'accès à la production. L'incident a donc été signalé par l'exploitation, qui n'est pas sur place.

Nous avons lancé une procédure de diagnostic. Les équipements réseaux se sont alors mis en sécurité suite à une montée en température du local en lien avec un arrêt de la climatisation. Mais le système continuait de marcher. Les applicatifs impactés ont donc pu être fermés « proprement ». Chorus Formulaires n'a pas été touché. De la même façon, l'interfaçage avec les applicatifs de chaque ministère n'a pas été impacté alors que l'ensemble du SI est hébergé sur le même site.

CIO : Quelle est l'architecture technique ?

Emmanuel Spinat : Nous utilisons des serveurs Bull sous AIX avec des puces PowerPC 6 ou 7 pour héberger les applicatifs de bases de données. Ces serveurs sont plus résistants à la chaleur que les équipements réseaux et ne se sont pas mis en sécurité, contrairement à ces derniers. Par ailleurs, nous utilisons des baies de stockage EMC en RAID 6.

CIO : Que savez-vous à ce moment-là ?

Emmanuel Spinat : Bull nous a signalé qu'il y avait eu un dégazage [déclenchement du système anti-incendie à base de gaz inerte pour étouffer les incendies, NDLR]. Ce dégazage a entraîné l'arrêt de la climatisation, donc (...)

Lire la suite dans CIO.PDF 71

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis

    La question du moment
    Disposez-vous d’une plateforme pour échanger des flux de données en temps réel entre applications ?