Projets

Le groupe RATP teste la traduction instantanée de l'information aux voyageurs

Le groupe RATP teste la traduction instantanée de l'information aux voyageurs
Xavier Chapuis, responsable du programme IA du groupe RATP : « Notre ambition est de traduire automatiquement les messages d’information voyageurs en français vers d’autres langues. »

Le groupe RATP a évalué la solution de Systran pour traduire instantanément les messages d'information aux voyageurs non francophones, dans le cadre d'un projet d'innovation dénommé TRAD.IV.IA.

PublicitéLa Régie autonome des transports parisiens (RATP) prend en charge 12 millions de voyages quotidiens sur ses réseaux franciliens, dont 10% effectués par des touristes. Afin de mieux informer les voyageurs non francophones, le groupe a lancé un projet d'innovation dénommé TRAD.IV.IA, visant à traduire de façon instantanée les messages d'information voyageurs en station, en particulier en cas d'aléas sur les lignes. Pour ce projet, le groupe a retenu la solution de Systran, spécialement entraînée pour s'adapter au domaine du transport de voyageurs.

« En cas d'incidents sur le réseau, nous avons des agents chargés de traduire les messages techniques en informations compréhensibles par les voyageurs, à la fois sous forme de messages sonores et textuels », explique Xavier Chapuis, responsable du programme intelligence artificielle (IA) du groupe RATP. Ces adaptations doivent se faire dans un délai très court : cinq minutes au maximum doivent s'écouler entre la survenue d'un incident et la diffusion du message d'information. « La simple qualification en français des codes d'incidents techniques peut prendre jusqu'à trois minutes. Cela laisse trop peu de temps pour pouvoir traduire les messages dans d'autres langues et informer rapidement les voyageurs étrangers », souligne Xavier Chapuis. Ce constat est à l'origine du projet TRAD.IV.IA, mené en collaboration entre les métiers du groupe et le département d'innovation. « Notre ambition était de traduire automatiquement le message d'information une fois formalisé en français, pour le restituer ensuite sous forme textuelle et vocale », justifie le responsable du programme IA.


Les agents RATP testent la traduction des messages en station.

Un prototype sur l'anglais et l'allemand

La solution de Systran a été choisie pour son expertise en traduction, mais aussi car l'éditeur voulait se positionner sur le secteur du transport, contrairement aux autres acteurs du marché. Enfin, il pouvait grâce à ses capacités d'IA adapter le moteur aux spécificités du groupe RATP. Il s'agit par exemple de prendre en compte le champ lexical propre au transport de voyageurs, ou de reconnaître les termes à ne pas traduire, comme les noms des stations Charles de Gaulle-Etoile, La Défense, etc. Pour entraîner le moteur au niveau de qualité souhaitée, le groupe RATP a fourni un corpus de données, comportant 50 000 messages à traduire, adapter et valider, 5 heures de messages sonores et 1 200 messages différents. Un prototype a ensuite été réalisé pendant la crise sanitaire, autour de deux langues, l'anglais et l'allemand. Celles-ci ont été retenues car il s'agissait de pays non francophones proches. Par ailleurs, l'allemand permettait également de « challenger le moteur », avec une construction des phrases très différente de l'anglais. « Il faut compter 3 mois d'entraînement par langue, avec d'autres cycles de 3 mois par la suite pour affiner l'entraînement », précise Xavier Chapuis.

PublicitéLa solution mise en place comporte trois grandes briques complémentaires : text-to-text pour traduire un message textuel dans une autre langue, text-to-speech pour le transcrire sous forme sonore avec une voix de synthèse, et enfin speech-to-text, pour convertir des annonces vocales en texte. « En les combinant, il est également possible de traduire en speech-to-speech », pointe Xavier Chapuis. Grâce à ce prototype, présenté lors du salon Vivatech, le groupe RATP a pu vérifier la rapidité de la traduction automatisée : entre 15 et 20 secondes selon le type d'annonce. A l'heure actuelle, la plateforme de traduction est hébergée chez un partenaire du groupe et interfacée avec le système d'information interne. Ce choix d'infrastructure « pragmatique » a permis d'aller vite sur la réalisation du prototype, afin de valider la solution. Toutefois, le recours au cloud pour l'industrialisation n'est pas exclu, même si pour l'instant aucun scénario n'a été retenu.


La solution va être déployée sur les lignes 1 et 4 du métro, ainsi sue sur le RER B, lors d'une phase pilote.

Un pilote en vue des JO 2024

En septembre 2021 va démarrer une phase pilote d'industrialisation, avec un déploiement de la solution prévu sur les lignes 1 et 14 du métro parisien, ainsi que sur le RER B. « Notre but avec ce pilote est de collecter le maximum d'enseignements constructifs, afin d'accompagner les métiers qui rédigeront le marché public », confie Xavier Chapuis. À terme, l'objectif est d'étendre la solution à l'ensemble des lignes, afin de proposer d'ici 2024 une information voyageurs multilingue. Les futures langues à intégrer seront choisies par les métiers, notamment en prévision des Jeux olympiques et paralympiques de 2024, dont les langues officielles sont le français, l'anglais, l'arabe, le chinois et l'espagnol. « Avec des langues comme l'arabe ou le chinois, qui ont de nombreuses variations régionales, ou encore l'espagnol européen et sud-américain, l'une des difficultés est de choisir vers quelle variation traduire », note Xavier Chapuis. Selon ce dernier, la technologie suscite également un fort intérêt en interne sur d'autres cas d'usages, pour le moment confidentiels.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis