Stratégie

Dette technique sur la donnée : un handicap majeur pour la stratégie IA

Dette technique sur la donnée : un handicap majeur pour la stratégie IA
L’IA révèle les insuffisances des organisations dans la gestion de données et l’alignement de leurs processus. Une dette qu’il faut résorber progressivement, tout en lançant de premières applications avec la technologie. (Photo : AbsolutVision/Pixabay)

La qualité des données et leur gouvernance étant essentielles au succès de l'IA, les DSI - et leurs PDG - ne peuvent plus ignorer la dette accumulée sur la data. Et sursoir aux investissements nécessaires pour la réduire et la garder sous contrôle.

PublicitéLe succès de tout projet d'IA repose sur des pratiques de données irréprochables. Or, alors que les PDG et les conseils d'administration ont mis l'accent sur la transformation numérique ces dernières années, le financement des initiatives de gestion des données est resté, au mieux, fragmentaire. Aujourd'hui, l'IA étant au coeur des priorités des directions générales, de nombreux DSI se retrouvent face à un mur : comment refondre les opérations data et résorber des années, voire des décennies, de dette accumulée sur le sujet ? Cette dette peut avoir diverses origines : pratiques de gestion des données obsolètes, raccourcis et compromis au niveau de l'infrastructure pour atteindre des objectifs à court terme, sources de données mal documentées ou encore pratiques de stockage inefficaces.

Si votre entreprise souffre d'une dette de données, l'IA la révélera. En effet, cette dette peut entraîner des taux d'échec catastrophiques pour les projets utilisant cette technologie. Pour les responsables IT, réduire cette dette via une stratégie de remédiation globale devient dès lors une urgence.

Le cabinet d'études IDC, dans ses prévisions pour 2026 concernant l'agenda des DSI, souligne que d'ici 2027, les DSI qui retardent la mise en oeuvre cet effort de remédiation seront confrontés à des taux d'échec sur les applications d'IA supérieurs de 50% et à une hausse des coûts. « Ces conclusions confirment que le déploiement de l'IA à grande échelle exige des investissements ciblés dans les infrastructures de données et les plateformes intégrées, et que le report de ces investissements fondamentaux risque de transformer les ambitions en matière d'IA en frictions opérationnelles persistantes », indique IDC.

Incohérences révélées par l'IA

« L'IA ne crée pas de problèmes de données ; elle les révèle et les accélère, explique Hrishikesh Pippadipally, DSI du cabinet d'audit et de conseil Wiss. Lorsque les organisations manquent de processus standardisés, de définitions cohérentes et d'une gouvernance des données rigoureuse, les données se dégradent naturellement avec le temps. Cette dégradation peut être invisible dans les environnements de reporting traditionnels, mais les systèmes d'IA mettent rapidement en évidence ces incohérences. »

La dette de données résulte souvent d'une dérive des processus : définitions différentes entre les équipes, normes de saisie de données incohérentes et systèmes cloisonnés évoluant indépendamment, souligne le DSI de Wiss. « Sans standardisation et sans attribution claire des responsabilités, même les systèmes modernes se dégradent, note-t-il. Dans notre organisation, nous avons constaté que la remédiation ne se limite pas au nettoyage des données historiques. Il s'agit de mettre en place des processus rigoureux pour prévenir toute dégradation future : une attribution claire des responsabilités en matière de données, des flux de travail standardisés et une gouvernance intégrée aux opérations quotidiennes. »

PublicitéCela dit, toutes les initiatives d'IA ne se trouvent pas forcément bloquées par des données imparfaites, précise Hrishikesh Pippadipally : « il existe des cas d'usage plus restreints et bien délimités, comme la synthèse de documents, l'aide à la rédaction, le signalement d'anomalies ou le support à la réconciliation, qui peuvent apporter une réelle valeur ajoutée grâce à une vérification humaine. Ces applications ciblées permettent aux organisations de développer leur maturité en IA pendant que des améliorations fondamentales sont apportées à la gestion de données.»

Risque d'automatiser le chaos

Problème répandu, la dette de données s'est développée organiquement au fil des décennies dans la plupart des organisations. Outre l'importance croissante accordée à la collecte de données, les entreprises ont également accumulé une dette au fil des fusions et acquisitions, et des déploiements de nouveaux systèmes et services à l'échelle de l'entreprise ou d'un département. « Les systèmes ont été conçus en fonction de besoins immédiats : acquisitions, exigences réglementaires ou préférences des services, explique Hrishikesh Pippadipally. Avec le temps, l'incohérence des processus et des normes a engendré une fragmentation des environnements de données. »

De plus, les inefficacités de la gestion des données ont traditionnellement été gérées par des solutions de contournement manuelles, poursuit le DSI. « Les équipes rapprochaient les rapports manuellement. Les analystes compensaient les définitions incohérentes. Or, l'IA réduit la tolérance à l'ambiguïté. Lorsque les systèmes automatisés fonctionnent à grande échelle, les incohérences se multiplient au lieu de s'atténuer. »

S'attaquer à ce problème dès maintenant devient donc crucial, car les initiatives en matière d'IA progressent plus vite que la maturité des processus. L'urgence est palpable. « Si les organisations n'institutionnalisent pas la rigueur et la standardisation des processus, elles risquent d'automatiser le chaos au lieu d'améliorer les résultats, souligne Hrishikesh Pippadipally. Le problème ne réside pas simplement dans la mauvaise qualité des données, mais aussi de l'absence d'une gouvernance durable pour garantir leur fiabilité dans le temps. »

Recommandations hasardeuses et automatisations dysfonctionnelles

Pour de nombreuses entreprises, la dette de données peut rester invisible lors de leurs analyses décisionnelles traditionnelles ou ponctuelles, ajoute de son côté Juan Nassif, directeur technique de la société de développement logiciel BairesDev. « L'IA est différente ; elle est beaucoup moins indulgente et révèle rapidement les doublons, les définitions incohérentes, le manque de contexte et les "champs mystères" à la provenance obscure », précise-t-il. Au-delà des projets pilotes, ces problèmes se traduisent par des performances réduites des modèles, des cycles d'itération plus longs et une augmentation des coûts opérationnels. C'est une préoccupation majeure pour nous aussi, et nous considérons cela comme une condition sine qua non d'un déploiement responsable de l'IA. »

Si les données sont incomplètes, incohérentes ou dupliquées, les résultats des modèles d'IA deviennent peu fiables. « Cela peut se traduire par des réponses erronées, de mauvaises recommandations ou des automatisations qui dysfonctionnent au pire moment, détaille Juan Nassif. Les équipes finissent par passer le plus clair de leur temps à nettoyer les données, à remanier les pipelines et à compenser les entrées de mauvaise qualité par des ajustements et des exceptions constants. »

On observe une forme ou une autre de dette de données dans tous les secteurs et dans les organisations de toutes tailles. « Je constate quotidiennement les conséquences de cette dette technique dans le cadre de mon travail avec les écoles britanniques, explique ainsi Mark Friend, directeur de Classroom365, cabinet de conseil en technologies, architecture et stratégies éducatives. La plupart des gens pensent qu'avec l'achat du dernier outil d'IA, tous leurs problèmes seront résolus, quelle que soit la complexité de l'infrastructure sous-jacente. Or, mon expérience m'a montré que même les logiciels les plus chers sont inutiles si les données d'entrée ne sont pas fiables. » Selon lui, la dette de données représente « un risque fondamental pour la stabilité des institutions ».

5 conseils pour une remédiation efficace de la dette

La remédiation de la dette de données à l'échelle de l'entreprise peut s'avérer complexe et coûteuse, impliquant de multiples aspects de l'activité. Il ne s'agit pas seulement d'un problème technologique, mais aussi d'un problème de discipline. Elle nécessite le nettoyage des données historiques et le renforcement de la gouvernance des processus afin d'éviter de reproduire les erreurs et mauvaises pratiques du passé. C'est pourquoi l'élaboration et la mise en oeuvre d'une stratégie efficace requièrent une approche organisée et rigoureuse. Voici quelques conseils d'experts.

1) Obtenez le sponsorship de la direction

Tout projet informatique d'envergure nécessite généralement l'adhésion des dirigeants et même du conseil d'administration, surtout s'il concerne une grande entreprise internationale. La remédiation de la dette de données ne fait pas exception. Sans l'aval et le soutien de la direction et du conseil d'administration, le risque financier est considérable.

Expliquer les conséquences potentielles est un bon moyen de mettre en évidence la nécessité de remédier à la dette de données. « Rendez la dette de données visible et reliez-la aux risques commerciaux, explique Juan Nassif. Cette dette ne sera pas considérée comme prioritaire tant qu'elle ne sera pas liée aux taux d'échec de l'IA, à la hausse des coûts et aux risques de non-conformité. »

La dette data représente désormais un risque à prendre en compte au niveau du conseil d'administration, affirme Adrian Lawrence, fondateur du cabinet de recrutement de cadres NED Capital, qui conseille les conseils d'administration et les directeurs financiers sur la gouvernance des données d'entreprise, l'intégrité du reporting et la préparation à l'IA. « Je constate une pression croissante sur les conseils d'administration qui lient leurs investissements en IA aux objectifs de productivité et de rentabilité, mais des données financières, commerciales et opérationnelles disparates nuisent gravement à la précision des modèles », prévient Adrian Lawrence. Selon lui, la réussite des efforts de résorption de la dette suppose le soutien de la direction, une gouvernance des données rigoureuse et un nettoyage progressif de l'architecture, « avec des données considérées comme un actif au bilan. »

2) Standardiser les processus clés avant le déploiement de l'IA

Pour que les bénéfices de la remédiation de la dette soient durables, les entreprises doivent standardiser leurs processus métier essentiels. « La qualité des données reflète la qualité des processus, affirme Hrishikesh Pippadipally. Les dirigeants doivent s'accorder sur des flux de travail, des définitions et une utilisation du système standardisés avant d'espérer un fonctionnement cohérent de l'IA. Sans standardisation des processus, les efforts de remédiation seront éphémères. » L'IA est plus performante dans des environnements prévisibles, explique le DSI, et la standardisation crée la stabilité dont elle a besoin.

BairesDev a intégré des contrôles automatisés de la fraîcheur, de l'exhaustivité, des doublons et des modifications de schéma des données, afin que les problèmes de qualité soient détectés avant qu'ils n'atteignent les flux analytiques ou d'IA, précise Juan Nassif.

3) Définir la propriété des données et la gouvernance

Un autre moyen de garantir les bénéfices à long terme d'un effort de réduction de la dette consiste à mettre en place des processus de gouvernance et des formes de responsabilisation. « La remédiation sur les données n'est pas une opération de nettoyage ponctuelle, prévient Hrishikesh Pippadipally. L'attribution claire de responsabilités au niveau de chaque domaine de données et la mise en place d'un monitoring continu empêchent toute nouvelle dégradation des données. » C'est essentiel, car c'est la gouvernance qui garantit la pérennité de la stratégie. « Sans discipline, les organisations accumulent à nouveau une dette de données, même après des efforts de nettoyage », reprend le DSI de Wiss.

« Nous avons renforcé la définition des responsabilités en matière de jeux de données et standardisé les définitions métier courantes afin que les équipes ne soient pas formées ou interrogées sur des "versions de la vérité" contradictoires, explique Juan Nassif (BairesDev). Nous avons amélioré nos pratiques de catalogage et de traçabilité afin que les équipes puissent retracer l'origine des données, leurs transformations et les personnes autorisées à les utiliser - un point crucial pour la confiance et la gouvernance. »

Le changement le plus important réside finalement dans l'état d'esprit. « Nous ne considérons pas la remédiation des données comme un nettoyage ponctuel, précise le CTO. Nous l'envisageons comme un processus d'ingénierie continu, assorti de garde-fous qui empêchent la réapparition d'une dette sur les données. »

4) Prioriser les cas d'usage d'IA à forte valeur ajoutée et circonscrits

Tandis que les initiatives de modernisation des données à grande échelle progressent au sein d'une organisation, les DSI peuvent déployer l'IA dans des domaines bien définis où les résultats sont vérifiables et la supervision humaine simple, explique Hrishikesh Pippadipally. « Par exemple : l'aide à la rédaction, les rapprochements contrôlés, le tri dans les workflows ou le signalement des anomalies, énumère le DSI. Cette approche renforce la confiance au sein de l'organisation et démontre le retour sur investissement sans exposer l'entreprise à des risques liés aux données. »

5) Améliorer le stockage

En matière de stockage des données, il est indéniable que nombre d'organisations doivent impérativement revoir leurs approches. De mauvaises pratiques entraînent une mauvaise qualité des données, ce qui peut impacter les projets basés sur l'IA. « Les établissements scolaires ont souvent tendance à stocker leurs données comme dans un grenier, en entassant des cartons sans les regarder, constate Mark Friend (Classroom365). Quiconque a déjà vécu une refonte technologique sait qu'un stockage désordonné représente un fardeau financier considérable. »

Selon lui, des décennies de mauvaises pratiques de collecte « ont engendré une dégradation technique que nous ne pouvons plus ignorer ». « Vous pourriez penser que votre système de stockage existant est inoffensif, mais il représente en réalité un fardeau financier considérable sous la forme de coûts d'exploitation croissants », et peut avoir un impact négatif sur les initiatives en matière d'IA.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis