Les 8 signes avant-coureurs d'un désastre informatique


Désastres, incertitudes, échecs : comment les DSI américains font face
Nos confrères de CIO Etats-Unis ont interrogé des DSI de grands comptes d'Outre-Atlantique mais aussi des experts pour cerner les risques menaçants les DSI. Et les DSI américains ont expliqué aussi comment réagir et se prémunir. Ou choisir, au contraire, de se retirer sur la pointe des pieds avant...
DécouvrirDe graves désagréments attendent ceux qui ignorent les signes précoces d'une catastrophe informatique imminente.
PublicitéIl y a peut-être quelque chose de pourri dans votre service informatique. Si vous n'en avez pas connaissance rapidement, vous pourriez vous retrouver avec un désastre entre les mains. Les signes avant-coureurs sont peut-être déjà là et vous ne les avez pas encore remarqués. Voici les huit signes avant-coureurs d'une catastrophe potentielle et comment les conjurer. Si vous les ignorez, c'est à vos risques et périls.
1. Les utilisateurs arrêtent de se plaindre
Vous pensez qu'avoir moins de plaintes est une bonne chose. Vous avez probablement tort, explique Oli Thordarson, PDG d'Alvaka Networks, qui fournit des services informatiques aux PME, des entreprises qui doivent fonctionner 24 heures sur 24, 7 jours sur 7. Pour lui, moins de plaintes signifie souvent que les utilisateurs ont abandonné tout espoir de voir leurs problèmes résolus, ce qui peut entraîner toutes sortes de conséquences néfastes.
« Une diminution des demandes ne signifie pas forcément que le gestionnaire fait du bon travail », dit-il. « C'est généralement le signe que la communauté des utilisateurs a perdu confiance dans sa DSI ou son support, dans ce cas on assiste à une montée du shadow IT, le recours à des mécanismes de support des utilisateurs alternatifs et éventuellement à une réorganisation du personnel. »
Oli Thordarson assure que lorsque les utilisateurs se plaignent, cela signifie qu'ils s'attendent à ce que l'informatique réponde à leurs besoins. Chaque organisation a un certain nombre de tickets ouverts à tout moment, l'astuce consiste à établir une base de référence pour les plaintes, puis à faire très attention si ce nombre change radicalement. Une légère hausse des plaintes pourrait être due à une mise à niveau importante ou à d'autres changements majeurs. Un nombre décroissant de tickets de support pourrait résulter d'une amélioration significative des processus ou de la résolution d'un problème de longue date.
« Si vous ne pouvez pas répondre à la question de savoir pourquoi ils montent ou descendent, cela signifie que vous avez un gros problème », conclut Oli Thordarson.
2. La cantine est soudainement pleine d'étrangers
Si vous déjeunez au travail et que vous êtes entouré de personnes que vous ne reconnaissez pas, il y a de fortes chances que votre entreprise en rachète une autre et ne vous l'ait pas dit. Cette acquisition peut être bénéfique pour l'organisation, peut-être pas. Quoi qu'il en soit, votre équipe devra probablement mettre de côté des projets stratégiques et passer du temps à intégrer les systèmes et les données de l'entreprise nouvellement acquise. Cela peut réduire votre capacité d'innovation.
Deep Varma, vice-président de l'ingénierie pour le site immobilier californien Trulia, l'a constaté lorsqu'il travaillait chez Yahoo au milieu des années 2000. A l'époque où le portail de recherche a acquis la société Overture et une foule d'autres petites entreprises.
« Yahoo a acheté de nombreuses petites et grandes entreprises, la plupart de notre temps a été consacré à l'intégration, pas à trouver des moyens d'améliorer la pertinence des mots-clés de recherche ou la qualité », dit-il. « Quand j'étais là-bas, mon équipe se lamentait en permanence : « Oh mon dieu, je passe tellement de temps à faire de l'intégration ». Ce qui a beaucoup ralenti notre capacité d'innovation. »
Evidemment, vous ne pouvez pas dire à votre PDG d'arrêter d'acquérir des entreprises. « Zillow Group, la société mère de Trulia, a réalisé de nombreuses acquisitions au fil des ans, mais notre stratégie a généralement consisté à créer un portefeuille de marques capables de se suffire à elles-mêmes », explique Deep Varma.
Publicité3. Vous rencontrez toujours les mêmes problèmes
L'accumulation subtile mais inexorable de la dette technique doit nous alerter. « Un travail caché avec des nuits tardives, des interruptions mineures mais inexpliquées, des tâches simples qui prennent de plus en plus de temps, tous ces phénomènes se produisent trop souvent dans les organisations », explique Adam Serediuk, directeur des opérations chez l'intégrateur xMatters.
Un certain degré d'inefficacité est inhérent à toute organisation et la plupart des processus tombent dans l'efficacité pour l'efficacité, admet Adam Serediuk. Mais quand les mêmes systèmes continuent de se rompre et que personne ne prend de mesures proactives, cela crée un obstacle incroyablement difficile à franchir. Le résultat est généralement l'épuisement professionnel des employés et des niveaux élevés de désengagement.
« Il y a toujours un moment où quelqu'un décide de quitter une organisation. Comme quand ils ont passé toute leur semaine à faire face au même problème pour la énième fois et qu'un recruteur leur envoie un message sur LinkedIn, alors ils passent à autre chose. »
4. Vous expédiez trop de code
Lorsque vous expédiez d'énormes blocs de code monolithiques, vous augmentez considérablement vos handicaps et risquez un effet de cascade qui peut faire tomber tout le système, explique Bruno Connelly, vice-président de l'ingénierie pour LinkedIn. « Bien qu'il soit tentant de tout faire à la fois, de gros morceaux de code avec des tonnes de petits changements sont beaucoup plus compliqués à travailler. Et quand quelque chose ne va pas, cela peut déclencher d'autres échecs plus systémiques. »
Il est beaucoup mieux d'expédier de plus petites quantités de code avec relativement peu de changements, et de les expédier plus souvent. « Nous avons optimisé nos systèmes pour expédier le code aussi souvent que possible », explique-t-il. « Et nous essayons d'expédier de petits morceaux de code en permanence, ce qui améliore vraiment notre efficacité en termes de validation du fait que tout a toujours les mêmes caractéristiques de performance et de dépendances en aval. »
Le réseau social s'assure également qu'il est préparé pour les pannes de système inattendues en les simulant délibérément. En novembre dernier, le site a lancé son framework LinkedOut, qui permet aux ingénieurs chargés de la fiabilité de déclencher artificiellement des échecs dans une application pour voir comment le service le gère. Une fois par jour, LinkedIn oblige également l'un de ses principaux centres de données à basculer, juste pour s'assurer qu'il dispose d'une capacité suffisante et que l'automatisation est en place pour supporter un désastre réel du centre de données.
5. Les employés cessent de vous solliciter avec des idées nouvelles
Lorsque vous mettez au défi votre équipe de s'attaquer à des problèmes difficiles ou de proposer de nouvelles stratégies et que vous n'avez pas de retour, vous savez que vous avez un sérieux problème de moral entre vos mains. « Si les gestionnaires et les utilisateurs arrivent à la DSI avec des idées et des propositions de solutions enthousiastes, ce gestionnaire fait un excellent travail de leadership et de gestion », explique Oli Thordarson. « Lorsque les utilisateurs cessent d'approcher avec de nouvelles idées, ils ont perdu confiance dans leur DSI ou bien versé dans le shadow IT. »
Cela pourrait provenir de l'incapacité du manager à encourager une culture de collaboration et d'expérimentation. « J'ai vu des entreprises où toute l'équipe informatique semble mépriser tout le monde », ajoute-t-il. « Si vous commencez à penser que votre employeur n'est qu'un hôte pour que vous puissiez exercer votre métier et vous familiariser avec les nouvelles technologies, vous n'êtes pas un très bon atout pour votre entreprise ! Il est probablement temps pour elle de faire appel à un nouveau leader. »
« Lorsque les équipes sont épuisées, vous vous heurtez à une forte réticence au changement, même si ce changement améliore leur propre vie », explique Adam Serediuk. « Ils vont supposer que ça va échouer, parce que jusqu'à présent il en va ainsi. Chaque changement a jusqu'ici aggravé leur vie, alors pourquoi celui-ci serait-il différent ? Vous devez être en mesure de répondre de manière appropriée »
6. Vous n'êtes plus invité aux réunions stratégiques
En informatique, aucune nouvelle n'est définitivement une bonne nouvelle. Si vous n'êtes pas impliqué dans des décisions de gestion importantes ou si vous participez à des sessions de stratégie de 3ème niveau, vous avez un problème. « Ne pas être invité à des réunions de direction de haut niveau est un signe important que vous avez été dégagé et que l'entreprise n'a plus besoin de vous », explique Oli Thordarson. « Il est clair qu'ils ne vous font pas confiance et ne pensent pas que vous ayez quelque chose à apporter ».
Certains reprochent aux responsables informatiques de ne pas se rendre compte que, pour gagner le respect de la direction, ils doivent décider des questions technologiques avec des objectifs commerciaux. « Vous ne pouvez pas simplement dire: nous avons besoin de nouveaux routeurs parce que le réseau est très lent, ou d'un nouveau logiciel parce que vous devez reconstruire la base de données tous les soirs. Si vous leur dites que reconstruire la base de données chaque nuit leur coûte deux millions de dollars par an, vous savez qu'ils vont répondre. »
Trop souvent, les DSI se passionnent pour l'infrastructure et perdent la trace de la stratégie de l'entreprise, explique Doug Bordonaro, chief evangelist pour ThoughtSpot, une société d'analyse axée sur l'intelligence artificielle. « Traditionnellement, les DSI se concentraient sur la sécurité, la conformité, la gestion des données et d'autres tâches fondamentales », explique-t-il. « Cela ne suffit plus dans l'économie numérique d'aujourd'hui. Si vous ne consacrez pas autant de temps à monétiser des données, à développer le secteur d'activité et à évangéliser sur le pouvoir des données dans votre organisation, vous ne tiendrez peut-être pas longtemps. »
7. Votre équipe souffre de trop d'alertes
Les responsables informatiques savent qu'ils doivent surveiller en permanence les systèmes d'entreprise critiques en temps réel. Mais avoir trop d'alertes est presque aussi inquiétant que d'en avoir aucune. « Que vous ayez 100 serveurs ou 5 000, votre tableau de bord de surveillance a toujours 30 alertes ouvertes », explique Adam Serediuk. « Il pourrait s'agir d'informations ou de problèmes connus, mais vous avez toujours ces 30 boutons rouges en face de vous, alors quand l'alerte critique apparaîtra, comment pourrez-vous la séparer des 30 qui ne sont que de l'écume ? »
Selon John Bruce, responsable de l'ingénierie des solutions chez SignalFx, une plate-forme de surveillance basée sur le cloud, deux problèmes potentiellement sérieux peuvent survenir avec le trop plein d'alertes. La première est que les responsables informatiques finissent par ignorer les alertes bruyantes, y compris les alertes potentiellement sérieuses. L'autre est l'épuisement professionnel et l'attrition.
Il se souvient avoir rendu visite à un client éventuel de SignalFx qui utilisait encore des outils existants pour surveiller une plate-forme d'hébergement dynamique basée sur le cloud.
« Les systèmes qu'ils avaient en place pour effectuer la surveillance étaient si prenants en nombre d'alertes que leurs employés opérationnels étaient complètement épuisés », explique Bruce. « Si vous vous faites constamment interpellé à 3 ou 4 heures du matin avec de fausses alarmes, ce n'est pas bon du tout ».
« Les gestionnaires doivent surmonter l'arriéré de leurs problèmes et les classer par ordre de priorité, en accordant le plus de poids possible aux problèmes qui peuvent avoir une incidence sur les clients, ce qui les affectera à leur tour », explique Adam Serediuk. La clé est d'être proactif, en utilisant des mesures comme signes avant-coureurs avant que les problèmes commencent à avoir un impact sur les utilisateurs.
8. La police est à votre porte
Les fuites de données et les failles de sécurité sont à l'esprit de tout DSI ou RSSI, mais ce n'est pas toujours évident de savoir où porter son effort. Selon Paul Moreno, expert en cybersécurité et conseiller de BugCrowd, les gros problèmes de sécurité sont souvent précédés de nombreux petits signaux. Par exemple, des problèmes de performance système inexplicables ou une sortie de données supérieure à la normale peuvent indiquer qu'un pirate tente d'exfiltrer des informations de votre entreprise. Une augmentation soudaine des tentatives de connexion à partir de nouveaux emplacements peut signifier qu'une tentative de violation de votre base de données client est en cours. Des demandes inhabituelles à vos API ou points de terminaison administratifs peuvent être un autre signe que quelqu'un essaie de pirater votre réseau.
« Avoir un contrôle de sensibilité plus élevé et même des déclencheurs autonomes, tels que le verrouillage, pour les points de terminaison administratifs internes est essentiel pour toute armure de sécurité ». Cela aide aussi à être proactif. L'implémentation de l'authentification avec deux facteurs peut empêcher les voleurs d'utiliser des mots de passe volés. En outre, les fournisseurs de renseignements de sécurité peuvent analyser le Darknet et vous alerter s'ils trouvent des indications d'un compromis accessible aux pirates informatiques.
Et le signe le plus sûr (et le pire) ? « Avoir un agent spécial de la police ou un fournisseur de sécurité qui contacte votre organisation pour vérifier des données récemment acquises, mais qui ne correspondent à rien dans vos entrepôts de données, c'est généralement la confirmation qu'une fuite de données s'est déjà produite. »
Dan Tynan / IDG News Service (adapté par Didier Barathon)
Article rédigé par

IDG News Service,
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire