Comment la RATP a remis sa data sur les rails

La régie des transports dresse le bilan de la transformation de ses usages de la donnée, portée par la construction de plateformes mutualisées et l'installation d'une Data Factory forte d'une centaine de personnes.
PublicitéArrivé à la RATP en 2021 en provenance de Safran pour s'occuper des activités data, Antoine Charpentier a dressé, lors du salon Big Data et AI, qui se tenait à Paris les 1er et 2 octobre, le bilan de la refonte de ce qui est, selon lui, un atout indispensable dans les mutations que connaît la régie. Parmi celles-ci, en premier lieu, l'ouverture à la concurrence sur son marché historique francilien, qui touche le réseau de bus dès 2025, avant de s'étendre au tramway en 2029.
S'y ajoutent les défis touchant à l'exploitation, la performance de la RATP faisant l'objet d'un contrat avec Ile-de-France Mobilités au sein duquel la régie se voit fixer des objectifs de régularité. « La qualité des opérations est donc essentielle. Nous misons largement sur la data sur ce terrain », indique celui qui a pris, il y a trois ans, la tête de la Data Factory du 3ème opérateur de transports urbains dans le monde, avec une présence dans 14 pays. D'autant plus que la RATP, qui emploie 71 500 personnes pour un chiffre d'affaires de 6,5 Md en 2023, doit gérer la mise en service d'un nouveau matériel roulant « hyperconnecté » (le MF19, appelé à équiper 8 lignes de métro) et assurer l'extension de son réseau francilien (avec 200 nouveaux kilomètres de voies et 68 gares supplémentaires).
Une Data Factory guidée par un manifeste interne
Or, selon Antoine Charpentier, le constat dressé en 2021 laissait apparaître des lacunes assez importantes dans la gestion de la data : un grand nombre d'infocentres servant les fonctions support, une plateforme Big Data sous-utilisée (250 serveurs physiques pour un seul cas d'usage !), une stack technologique hétéroclite, une gouvernance de la donnée encore embryonnaire. Et, évidemment, des métiers en demande. C'est ce bilan qui décide la régie des transports à lancer un plan d'action, comportant des recrutements et des investissements technologiques.
C'est aussi à cette occasion qu'est créée une Data Factory. « Nous avons réunis tous les experts de la donnée, des Data Scientists, des ingénieurs data, des chefs de projet, des Producs Owners mais aussi des contrôleurs de gestion, sur un plateau projet unique », raconte Antoine Charpentier. Soit « un collectif » d'une centaine de personnes, guidées par un manifeste interne (un clin d'oeil au manifeste agile), insistant sur la valeur que doivent créer les projets (évaluée avec un outillage dédié), sur le Time-to-market (un cadrage en 5 semaines, un MVP sous 3 à 4 mois) et sur le patrimoine technologique et humain. « Nous militons pour des plateformes centrales et un cadre de amenant une cohérence technique que voulons installer sur la durée », insiste le patron de la Data Factory.
Modèles prédictifs pour l'affectation de personnel
PublicitéD'où la construction d'une plateforme interne pour la data et l'IA, baptisée Diane. Une plateforme sur laquelle travaillent 20 personnes à temps plein, elle-même gérée comme un produit (avec des sprints de 6 mois). Mise en service en v1 en décembre 2022, Diane, bientôt en v10, est construite sur AWS, Databricks, PowerBI, Collibra (catalogue) et Collate (gestion des métadonnées). « Elle propose des données ordonnées associées à 12 domaines métier et une gestion avancée des droits », souligne Antoine Charpentier. 14 produits construits sur Diane sont aujourd'hui disponibles, contre huit en mai 2024. On y trouve ainsi un outillage dédié aux responsables de station, afin d'y piloter l'activité. Ou encore une solution à destination des conducteurs pour optimiser les gestes de conduite.
Si la RATP utilise l'IA en production depuis des années - en particulier pour la maintenance prédictive du matériel roulant -, de nouveaux usages émergent, comme l'utilisation de modèles prédictifs pour gérer les affectations de personnel - une mécanique de précision au sein de la régie du fait de la fréquence des métros par exemple - ou le déploiement d'un chatbot à base de GenAI en station, pour aider le personnel à accéder à l'information contenue dans la documentation relative aux équipements ou à la tarification.
<img src="https://www.cio-online.com/fichiers/telechargement/antoine-charpentier.jpg" width="74%">
Antoine Charpentier, directeur de la Data Factory de la RATP, sur la scène de Big Data & AI Paris, le 1er octobre. (Photo : R.F.)
Si la démarche couplant plateformes centralisées et décentralisation des usages, sur les principes du Data Mesh, s'installe peu à peu, avec une croissance du nombre de produits data en production, Antoine Charpentier insiste sur les efforts à consentir. Notamment en matière d'implication des parties prenantes concernées (DPO, cyber, CTO, DSI...) ; « si vous en oubliez ne serait-ce qu'une, vous êtes morts », dit-il. Mais en aussi en matière de communication interne. « En deux ans, nous avons organisé 15 visites de la Data Factory impliquant une partie du Comex, assure le responsable. Avec, à chaque fois, une tournée des projets, un zoom sur l'un d'entre eux et un point d'étape sur nos efforts en matière de gestion de la donnée. »
Article rédigé par

Reynald Fléchaux, Rédacteur en chef CIO
Suivez l'auteur sur Twitter
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire