Projets

L'Office européen des brevets automatise son processus de dépôt avec la GenAI

Romain Richard, directeur des SI de gestion des demandes de brevets de l’OEB : « nous parvenons à un bon niveau de structuration des données, notamment concernant les tableaux et les formules mathématiques ». (Photo : D.R.)

Afin d'accélérer l'intégration des demandes de brevets dans ses systèmes d'information, l'OEB s'est tourné vers un modèle de Mistral, pour structurer des données issues de sources variées. Une façon aussi de simplifier son patrimoine applicatif.

PublicitéUtiliser l'IA générative pour accélérer le traitement des demandes de brevets, notamment la reconnaissance des données non structurées parvenant à cette organisation sous de multiples formats, et automatiser leur structuration pour les systèmes exploités par les examinateurs de ces demandes. C'est cette intuition que l'Office européen des brevets (OEB), situé à Munich, a validé récemment via un co-développement avec l'éditeur Mistral. « Le traitement des demandes de brevets était un processus assez long, mélangeant recours à des solutions techniques et opérations humaines, raconte Romain Richard, le directeur des systèmes d'information de gestion des demandes de brevets de l'OEB. Nous disposions déjà de systèmes d'OCR d'anciennes générations et de systèmes déterministes, mais les capacités de ceux-ci restaient limitées. » En particulier, sur le traitement des tableaux, des formules mathématiques ou chimiques ou encore sur la gestion du multilinguisme, intrinsèque au périmètre couvert par l'OEB.

Autant d'aspects sur lesquels l'organisation a voulu tester les capacités de la GenAI en se rapprochant de Mistral, juste avant l'été 2025. « Nous disposons d'une source de vérité, constituée de décennies de données d'entrée et de résultats. Ce qui nous fournissait une capacité à entraîner un modèle », reprend le responsable de l'OEB. C'est ce jeu de données que Mistral a exploité pour adapter un de ses modèles aux besoins spécifiques de l'Office européen, pour des tâches de reconnaissance de caractères et de structuration des données. Le test, jugé positif par l'organisation intergouvernementale comptant 39 États membres, a débouché sur le déploiement du LLM en production pour traiter les quelque 200 000 demandes de brevets par an.

Hébergement sur les datacenters internes

Si le déploiement n'est pas encore totalement achevé - ce sera le cas tout prochainement,100% des demandes étant appelées à être traitées par le modèle Mistral, selon Romain Richard -, les résultats sont encourageants, assure-t-il. « Le taux d'erreurs est bien inférieur à 1% (contre environ 1% avec la panoplie d'outils préexistants, NDLR) et nous parvenons à un bon niveau de structuration des données, notamment concernant les tableaux et les formules mathématiques ». Si la phase de prototype a été largement conduite par l'éditeur, avec l'appui des équipes de l'OEB pour la connaissance métiers, ce sont bien les 10 à 15 employés travaillant sur le projet au sein de l'organisation qui ont mené l'essentiel de la phase d'industrialisation de la solution, hébergée dans les datacenters internes.

Le principal bénéfice du projet ? Une réactivité bien supérieure dans la phase d'enregistrement des demandes. « Nous passons d'une durée de traitement de 5 jours à quelques minutes. Or, cette fenêtre peut engendrer une forme de pression sur nos équipes, car une demande de brevets se déroule toujours en plusieurs étapes : nos examinateurs et/ou experts devaient ainsi parfois attendre plusieurs jours pour voir une étape de la procédure, de nature urgente, se matérialiser dans leurs systèmes », détaille Romain Richard.

PublicitéDécommissionnement de plusieurs systèmes

Au-delà de cet aspect et de l'amélioration de la qualité des informations parvenant aux examinateurs, le projet permet aussi de réduire les coûts, via une simplification du Legacy. Pour Romain Richard, le déploiement de la solution basée sur le LLM de Mistral s'inscrit dans un programme de transformation démarré dès 2018 et se traduisant par une mutation vers les architectures cloud-native et par la mise à la retraite d'applications d'anciennes générations. « A la faveur de ce projet, nous allons ainsi pouvoir décommissionner notre système d'OCR historique, les solutions de structuration de la donnée, mais aussi différents systèmes d'orchestration servant à l'injection des données dans les SI des examinateurs et agents de formalités », indique-t-il. Sans toutefois chiffrer le montant des économies attendues.

L'OEB, qui emploie un total de 6 300 agents dont plus de 4 000 scientifiques et ingénieurs, compte bien capitaliser sur ce premier déploiement, pour renforcer ses usages de l'IA dans le cadre d'une stratégie publiée en février 2025 (ici en PDF). « Le niveau de qualité atteint est déjà très bon, mais nous pensons qu'il est encore possible de le faire progresser, par exemple afin de mieux structurer les données des formules chimiques, souligne le directeur des systèmes d'information de gestion des demandes de brevets. Dans un second temps, nous voudrions aborder le traitement des figures et l'utilisation d'autres modèles d'IA intéressants pour nos différentes activités. »