Proposé par BOX & IBM

Extraire de la valeur des contenus non structurés grâce à l'Intelligence Artificielle (IA)

Les contenus non structurés contiennent une valeur inexploitée qui peut jouer un rôle de plus en plus important dans la prise de décisions stratégiques et dans la course à la différenciation. Nous savons aussi que ces données sont difficiles à collecter et à analyser. L'intégration de l'intelligence artificielle, comme le machine learning (ML), et le traitement du langage naturel (Natural Language Processing - NLP) à des processus opérationnels peut permettre aux entreprises de surmonter ce défi, d'aller chercher l'information pertinente là où elle se trouve, et de tirer le meilleur parti de leurs données.

Extraire de la valeur des contenus non structurés grâce à l'Intelligence Artificielle (IA)

Des données très majoritairement non structurées

Selon le cabinet d'analystes IDC, d'ici 2022, 93 % des données d'entreprise seront des données non structurées, essentiellement sous forme de vidéos, de photos, de fichiers audios, de présentations et de documents de traitement de texte. Par ailleurs, le cabinet de recherche Gartner, considère que ce type de contenu « n’est pas conforme à un modèle de données spécifique et prédéfini », ajoutant que « ces contenus, plutôt générés par l'homme et axés sur l’individu, ne s’adaptent pas facilement à la structure des tables d’une base de données ». Ces données, difficiles à localiser et d'analyser, représentent un véritable défi pour les entreprises qui ont déjà du mal à s’adapter au rythme de croissance exponentiel des flux de données, aussi bien du point de vue de la localisation, et leur mode de stockage, leur gestion, leur sécurisation que (de) leur analyse dans les environnements sur site, dans le cloud et autres plateformes ou systèmes hérités. De plus, avec l'entrée en vigueur du RGPD (Règlement général sur la protection des données) il y a un peu plus d’un an, le problème s’est amplifié. En effet, voilà longtemps que les analystes estiment que les données sont un différenciateur et que la capacité à extraire de la valeur des données confère un avantage concurrentiel aux entreprises qui en ont la maîtrise. Or, selon la Sloan School of Management du MIT, 80 % des données actuelles sont considérées comme non fiables, inaccessibles, ou impossibles à analyser, ce qui signifie, finalement, que ces données et leurs différents types de contenu ne peuvent apporter de valeur réelle à l'entreprise.

Un accès facilité grâce à l’IA

Heureusement, les progrès de l'intelligence artificielle et de l'informatique dans le cloud permettent désormais aux entreprises d’explorer beaucoup plus facilement ces données non structurées - comme du texte et des contenus multimédias - et d'en tirer une réelle valeur commerciale. Ainsi, les premiers cas d’usage de l’intelligence artificielle, notamment dans le domaine de la santé, ont exploité l'apprentissage machine (ML) pour tirer des enseignements à partir de données d'imagerie cérébrale et de tumeurs. Dans d’autres cas d’usage, c’est le traitement du langage naturel (NLP) qui a été mis en œuvre pour analyser des sons non structurés et développer des algorithmes qui permettent aux ordinateurs de traiter et de comprendre le langage humain. Un partenariat stratégique comme celui conclu entre Box et IBM, associant la Gestion de contenu dans le cloud de Box aux solutions IBM comme Watson et IBM Cloud, aide aussi les entreprises à transformer et à moderniser leurs contenus, à modifier leur manière de travailler dans le cloud, et à aller encore plus loin dans leur transformation numérique. Ainsi, « Box Skills » permet d’utiliser les technologies d’intelligence artificielle (IA) et de machine learning (ML) de fournisseurs tiers comme IBM Watson, pour la reconnaissance d'images, la transcription de paroles en texte, la compréhension du langage naturel, et plus encore, d’extraire une valeur inexploitée du contenu de Box. Par exemple, il est possible d’utiliser l’intelligence artificielle (IA) et le machine learning (ML) pour marquer et identifier des objets présents dans des photos ou pour transcrire un fichier audio en texte.

Les avantages d’un référentiel de contenu centralisé

Cette précieuse source d'informations facilite la recherche et l’extraction de contenus dans Box, et améliore le travail que les employés réalisent avec ces contenus. Elle permet également d’automatiser et d’accélérer des processus métiers obsolètes, et contribuer ainsi à réduire les risques de sécurité, et à répondre plus rigoureusement aux exigences de conformité. Enfin, en ce qui concerne les contenus propres des entreprises, le partenariat entre Box et IBM leur permet de constituer un référentiel de contenu centralisé qui leur apporte plusieurs avantages. Si, en premier lieu, ce référentiel améliore la collaboration interne et externe, et la productivité personnelle, il permet aussi de diminuer les coûts, de réduire les risques, de garantir les conformités requises, tout en améliorant la sécurité.

A lire aussi : 
Pas d'intelligence artificielle (IA) sans architecture de l'information (AI) pour une meilleure gestion de contenu avec IBM Watson

Partager cet article

Abonnez-vous à la newsletter CIO

Recevez notre newsletter tous les lundis et jeudis

La question du moment
Savez-vous évaluer votre degré de dépendance à un fournisseur ?