Proposé par Opendatasoft

Data lineage : le facteur clé de succès du développement de vos projets data

Les organisations ont pris conscience de l'importance de mettre en place un portail de données. Cette interface simplifie l'accès aux ressources data, permet aux équipes de gagner du temps et favorise la propagation d'une culture centrée sur les données.

Data lineage : le facteur clé de succès du développement de vos projets data

Ouvrir l'accès aux données à un large éventail d'utilisateurs sous-entend la création de nombreux usages. La difficulté pour les producteurs data et les administrateurs de portail réside dans le fait de savoir quelles sont ces réutilisations. Sans cette vision 360° des usages de leurs données, ils n’ont pas d’indicateurs fiables pour améliorer leurs portails et encourager encore plus de réutilisations.

Le Data lineage pour comprendre le parcours et l’usage des données

Que signifie Data lineage?

Le lignage des données, ou data lineage, désigne le processus d'analyse des usages des données. Cette analyse revêt une importance particulière dans le contexte où les organisations exploitent quotidiennement d'énormes volumes de données.

Comment discerner les données qui créent de la valeur ? Quels sont les datasets les plus utilisés ? Qui sont les consommateurs des données ? Quels sont les formats data les plus plébiscités ? Pour répondre à ces questions, il est indispensable d’analyser les comportements des utilisateurs. C’est ce que permet le data lineage en documentant les flux de données.

Data lineage et portail de données

Les portails de données permettent aux collaborateurs, partenaires, clients, ou au grand public d’accéder à des données mises à disposition par une organisation. En naviguant sur un portail data, chaque partie prenante peut choisir de réutiliser les données dans différents formats afin de créer de nouveaux usages. Une fonctionnalité de lignage des données permet d'identifier les diverses réutilisations des assets data.

Quels sont les bénéfices du lignage des données ?

Le lignage de données a pour objectif de répondre aux besoins des administrateurs de portails n’ayant aucune solution pour automatiser l’analyse de l’usage de leurs données. La fonctionnalité data lineage offre de nombreux avantages.

Améliorer la maintenance de son portail data

Un portail data regroupe des volumes de données exponentiels, et toujours en pleine croissance. Or, parmi les datasets disponibles, certains sont plus utilisés que d’autres.

Le data lineage permet aux administrateurs de portails de voir les relations entre les datasets et les objets les plus utilisés. Ils peuvent ainsi identifier les jeux de données les plus pertinents pour l’organisation, mais aussi ceux qu’il convient de supprimer, de modifier ou d’enrichir.

Le data lineage permet de faciliter la maintenance des portails de données :

• Si un format de données est régulièrement utilisé, il faudra l’utiliser en priorité,

• Si certains datasets sont très plébiscités, il est important de les traiter et de les améliorer en priorité,

• Si certaines relations sont invalides, elles peuvent être corrigées très rapidement.

À mesure que les organisations comprennent mieux les attentes de leurs utilisateurs, elles seront capables d’implémenter des processus data de plus en plus robustes. C’est-à-dire d’améliorer la qualité des données en continu, avec une maintenance basée sur les usages.

Renforcer la confiance des utilisateurs

Le data lineage permet de démontrer la valeur d’un portail de données. D’une part, en renforçant la traçabilité des données, le data lineage améliore la crédibilité des informations présentées. Leur origine est connue.  Ce qui augmente irrémédiablement la confiance des utilisateurs dans les données.

D’autre part, le lignage des données permet de faire apparaître clairement les bénéfices générés par les portails data. Cela renforce la confiance et l’intérêt des parties prenantes envers ce type de plateforme et permet d’engager les décisionnaires, comme un comité de direction chargé de définir le budget, ou encore un manager d’équipe.

 À travers tous ces bénéfices, le data lineage participe directement à tous les piliers d’une gouvernance de données efficace. À savoir : les processus de data management, la culture et les outils data. Il favorise ainsi la démocratisation et la valorisation des données.

Partager cet article

Abonnez-vous à la newsletter CIO

Recevez notre newsletter tous les lundis et jeudis