Projets

Un programme industrialisé pour le Big Data d'Air France

Un programme industrialisé pour le Big Data d'Air France
« Bien prévoir la demande sur les vols d'Air France KLM nécessite des approches big data que nous avons commencé à prototyper en 2011 », relate Thierry Vanhaverbeke, manager du service de recherche opérationnelle d'Air France KLM. (crédit : D.R.)

A travers un programme Big Data destiné aux métiers d'Air France KLM, la DSI de la compagnie aérienne a suscité la mise en place de nombreux cas d'usage. Une expertise a été développée en interne autour de ces technologies, avec des outils pour industrialiser la mise en production.

PublicitéChez Air France KLM, le service de recherche opérationnelle rattaché à la DSI intervient de façon transversale au sein de la compagnie aérienne, entre Paris et Amsterdam, pour réaliser des prévisions sur différents domaines, en particulier sur le trafic, la demande, la recette et sur les annulations afin de gérer la suroffre. « C'est un service clé qui existe depuis longtemps et qui travaille en lien avec la data science depuis de nombreuses années », nous a exposé Thierry Vanhaverbeke, manager au sein du service. « De plus en plus de méthodes de machine learning sont utilisées pour les prévisions et pour déterminer les caractéristiques permettant de bien gérer la suroffre, par exemple » souligne Thierry Vanhaverbeke. Sur un effectif de 60 personnes, un tiers du service de recherche opérationnelle sont des data scientists.

Air France KLM transporte 90 millions de passagers par an sur 320 destinations dans 114 pays et gère entre 2000 et 2200 vols par jour. « Bien prévoir la demande nécessite des approches big data que nous avons commencé à prototyper en 2011 sur le nouveau système de revenue management destiné à optimiser la recette de nos vols. Engagé dans les années 70, l'optimisation de la recette continue d'évoluer dans le contexte très concurrentiel des compagnies aériennes », rappelle Thierry Vanhaverbeke. Les données de deux années d'historique de réservation sont ainsi exploitées en recourant à des approches big data pour réaliser une prévision sur plus d'un an. Avec ce projet a été mis en place un premier système Hadoop 1 avec MapReduce. Son succès a ensuite amené la DSI à lancer un programme big data pour renforcer son savoir-faire sur ce terrain et pour promouvoir l'exploitation des données volumineuses auprès des différentes directions métiers de la compagnie aérienne (Cargo, finance, CRM, revenue management, personnel navigant, entre autres directions). Plusieurs cas d'usage ont ainsi été développés. « Cela nous a permis d'avoir une expérience big data en interne, de développer des compétences sur ces technologies et de faire prendre conscience aux métiers des enjeux liés à ces sujets », explique Thierry Vanhaverbeke.

24 millions de clients fidélisés

A l'issue de ce programme, qui a aussi permis de standardiser les outils, l'infrastructure big data d'Air France KLM s'appuie maintenant sur la distribution Hadoop d'Hortonworks en version 2.5 et sur la solution de Talend pour la gouvernance technique des données. L'un des cas d'usage du programme big data a porté sur la personnalisation de la relation client. Il s'est concrétisé l'an dernier par le lancement d'une plateforme qui centralise le suivi des échanges avec deux ans d'historique. La compagnie aérienne compte 24 millions de clients fidélisés qui représentent environ 50% de son chiffre d'affaires. En moyenne, une vente s'effectue toutes les cinq secondes. « L'objectif, c'est de pouvoir établir une interaction en temps réel avec les clients et de les suivre tout au long de leur parcours, lors de la commande, à l'aéroport, chez eux, de fluidifier l'échange quel que soit le canal, site, médias sociaux ou call center et de personnaliser la réponse », expose Thierry Vanhaverbeke.

Publicité Plusieurs métiers sont concernés par cette plateforme. Parmi ceux-ci figurent notamment le centre d'appels, le personnel à l'exploitation au sol chargé de l'enregistrement ou encore les équipes qui gèrent les médias sociaux (Air France KLM compte 3 millions de followers sur Twitter et 19 millions de fans sur Facebook avec 35 000 interactions par mois). A partir de tablettes, les agents au sol ont un accès instantané à toutes les réservations des passagers et peuvent les aider très rapidement en cas de besoin. La mise en production de cette application de relation client personnalisée s'est appuyée sur la maturité acquise à travers le programme big data de la DSI. « Ce sont ces compétences qui nous ont permis d'industrialiser les projets », souligne le responsable du service de recherche opérationnelle. Un autre cas d'usage a été développé sur la maintenance prédictive. L'enjeu consistait à prévenir les pannes sur les A380, à partir de l'ensemble des données des capteurs qui sont générées au cours des vols pour détecter des signaux. Lancé il y a un an et demi et mis en production, il a permis d'anticiper des pannes et va maintenant s'étendre à d'autres types d'avion, nous a précisé Michaël Chalamel, analyste au sein du service de recherche opérationnelle, chargé de l'industrialisation des applications big data. D'autres sujets sont abordés sur la gestion des plaintes par l'analyse de questionnaires à travers le text mining.

Un framework pour industrialiser les cas d'usage

Dans sa démarche, Air France KLM a travaillé avec un cabinet de conseil spécialisé dans les technologies big data et les environnements agiles, Xebia. « Avec eux, nous avons mis en place un framework pour accélérer la mise en production de modèles de machine learning », explique Michaël Chalamel qui a également présenté ce retour d'expérience sur la conférence Xebicon en novembre 2016. « Il y a de plus en plus une accélération de la demande des métiers. Il est donc clé de mettre rapidement des modèles en production ». Le temps de mise à disposition varie suivant le cas d'usage, de quelques jours à plusieurs mois, selon la nature des données récupérées en entrée et des traitements de préparation et de nettoyage qu'il faut effectuer. Mais dans tous les cas se pose une même problématique, celle de travailler sur du code d'assez bas niveau. D'où le framework qui permet d'accélérer toutes les étapes entre la conception du modèle d'apprentissage machine et sa mise en production. Il accélère l'accès à l'exploration pour des cas d'usage métier identiques, fournit aux data scientists des modèles pour y répondre et des outils pour simplifier leur travail, explique Mouloud Lounaci, ingénieur données chez Xebia. « Le framework permet aussi d'automatiser le pipeline de delivery quand le code est structuré et mis en place », complète-t-il.



Michaël Chalamel, analyste au sein du service de recherche opérationnelle, chargé de l'industrialisation des applications big data.

« Nous avons un environnement de discovery pour évaluer différents modèles à partir des use cases détectés en amont et des différents types de données à analyser », décrit Michaël Chalamel. « Lorsqu'un modèle est validé avec le métier et qu'il faut le déplacer sur une plateforme opérationnelle, le framework va nous aider à le transformer en un module maintenable comportant des briques d'intégration avec les systèmes opérationnels en utilisant le langage big data temps réel Spark avec Python, et Java pour les systèmes opérationnels ». Pour simplifier l'interaction avec ces modules, le framework permet de préparer les briques nécessaires et de packager le modèle. Autour des plateformes Hortonworks 2.5 et Talend, le service de recherche opérationnelle étudie le logiciel notebook Apache Zeppelin qui pourrait devenir son outil favori pour l'exploration. Il recourt à HBase et Hive pour les bases de données, à Spark pour le calcul opérationnel et à MongoDB pour le rendu en termes d'API Rest. « Les prochains modules devront s'inscrire dans cet outillage », nous a indiqué Michaël Chalamel. « Sur les prochains outils, nous allons suivre les évolutions de Spark 2.0 ». Parallèlement, Air France KLM gère également un datawarehouse.

Une chaire data science avec l'Ecole des Ponts ParisTech

Le programme big data monté par la DSI a atteint ses objectifs en ayant apporté aux métiers une bonne connaissance des enjeux et potentiels de ces technologies. De nombreux PoC ont été industrialisés. Les compétences sont maintenant installées et les projets sur de nouveaux cas d'usage vont pouvoir se réaliser de manière autonome. De son côté, le service de recherche opérationnelle poursuit son travail sur les prévisions. Il revoit entièrement les techniques utilisées pour prévoir la demande sur les vols en s'appuyant sur ses systèmes big data. La croissance du service de recherche opérationnelle s'est faite sur la partie data science, précise Thierry Vanhaverbeke. « Nous continuons à recruter pour faire grossir cette équipe », ajoute-t-il. Air France KLM a notamment monté avec l'Ecole des Ponts ParisTech la chaire « Recherche Opérationnelle et Apprentissage » qui combine les aspects data science et optimisation. « Les premiers étudiants suivront le cursus cette année, mais cela va se mettre en place sur les 5 ans. » Des sujets de recherche vont être identifiés pour faire l'objet d'une thèse qui démarrera l'an prochain.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis