Technologies

Le cloud, 100% résilient ? Google Cloud montre qu'il n'en est rien

Le cloud, 100% résilient ? Google Cloud montre qu'il n'en est rien
Le site et l'application mobile d'Unisuper ont été indisponibles pendant près d'une semaine suite à une erreur de Google Cloud.

Il aura suffi d'une erreur de configuration chez Google Cloud pour mettre hors ligne le fonds de pension australien Unisuper. Son cloud privé a été purement et simplement supprimé. Et ce, sur ses deux zones cloud. Engendrant des perturbations pendant une semaine entière.

PublicitéC'est Thomas Kurian, le Pdg de Google Cloud, qui s'est fendu d'un mea culpa suite à une panne rarissimes des services cloud du fournisseur. En cause, la mésaventure vécue par le fonds de pension australien Unisuper, victime d'une interruption de son service de cloud privé pendant une semaine. Dans un communiqué commun, les deux sociétés ont attribué cette panne à « un évènement sans précédent ». Le message ajoute que ce bug résulte « d'une combinaison de problèmes rares chez Google Cloud, combinaison qui a entrainé par inadvertance une mauvaise configuration lors du provisionnement du cloud privé d'Unisuper ».

Le fonds disposait certes d'une duplication de ses données sur deux zones géographiques du cloud de Google, pour se protéger contre les pannes et les pertes. Sauf que, lors de l'arrêt du cloud privé d'Unisuper, l'erreur de configuration s'est traduite par « une suppression de ces deux zones géographiques ». La panne a démarré le 1er mai et la résolution du problème, elle, n'a débuté que le 8 mai dernier.

Le salut vient des sauvegardes externes

Car, malgré la suppression des deux régions de duplication, Google Cloud et Unisuper ont réussi à limiter la casse. « « La restauration de l'instance de cloud privé d'Unisuper a nécessité énormément de concentration (sic), d'efforts et de partenariat entre nos équipes pour parvenir à restaurer tous les systèmes de base », a précisé Google dans sa communication.

Le fonds de pension avait également mis en place des sauvegardes auprès d'un autre fournisseur de services, ce qui a permis de minimiser les pertes et d'aider les deux entreprises au cours du processus de restauration. « Google Cloud s'excuse sincèrement pour la gêne occasionnée, et nous continuons à travailler 24 heures sur 24 avec Unisuper pour remédier à la situation, afin de rétablir progressivement les services dès que possible », indique encore le fournisseur.

Continuité de l'activité d'investissement

Si, jeudi 9 mai, en milieu d'après-midi, heure d'Australie, les retraités pouvaient se connecter à leurs comptes, le solde n'était ainsi pas encore mis à jour. Cependant, les investissements et les transactions se sont poursuivis normalement tout au long de la panne et les fonds des clients n'ont pas été touchés. Le mercredi précédent, Peter Chun, CEO d'Unisuper, avait également envoyé un courriel à ses clients, pour les assurer de la sécurité de leurs comptes et de la continuité de l'activité d'investissement pendant la panne.

« L'activité d'investissement habituelle sera reflétée dans votre solde une fois que nos systèmes seront complètement rétablis, assurait alors le dirigeant. Pour les investissements n'ayant pas été affectés par la panne, nous avons mis à la disposition des membres des informations actualisées sur les performances des options d'investissement sur notre site web ». Qualifiant le problème « d'incident isolé », Google a aussi assuré aux membres d'Unisuper que l'interruption de service n'était pas due à une cyberattaque et que leurs données sensibles n'avaient donc pas été exposées à des entités tierces. Le 13 mai, dans une mise à jour, Peter Chun indique que l'ensemble des accès (site et mobile) ont été rétablis.

PublicitéUn temps de résolution « anormalement long »

Les principaux fournisseurs de services - notamment Amazon Web Services, Microsoft Azure et d'autres - ont tous fait l'expérience d'une panne sérieuse à un moment ou à un autre. En juin 2023, AWS a ainsi connu un incident de plus de deux heures qui a affecté un certain nombre de services sur la côte est des États-Unis. En septembre de l'année dernière, Microsoft Azure a aussi été confronté à une panne de datacenter en Australie, qui a empêché les utilisateurs d'accéder aux services Azure, Microsoft 365 et Power Platform pendant plus de 24 heures.

De l'avis de Pareekh Jain, Pdg d'EEIRTrend et de Pareekh Consulting, « la panne d'Unisuper fait figure d'exception par sa durée ; en général, ces problèmes sont résolus assez rapidement ». L'évènement pourrait ainsi nuire à la réputation de Google Cloud. « Le temps de résolution de cette panne est anormalement long, ce qui a un impact négatif sur la réputation de Google Cloud », dit Pareekh Jain.

« Ce genre de pannes peut entraîner des interruptions d'activité et des pertes de données pour les clients, ce qui explique pourquoi de nombreuses entreprises privilégient une stratégie multi-cloud pour réduire les risques », observe l'analyste. Unisuper avait l'habitude de répartir ses applications entre Azure et deux datacenters maison, mais la firme australienne a mené une importante migration vers Google Cloud Platform l'année dernière.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis

    La question du moment
    Avez-vous défini un processus de gestion et de résolution des incidents sur vos infrastructures ?