Projets

L'IGN explore la forêt française avec son propre modèle de fondation IA

L'IGN explore la forêt française avec son propre modèle de fondation IA
La phase de fine tuning des images satellites et aériennes de la forêt française dans le modèle Maestro de l'IGN. (Image IGN)

Pour cartographier le patrimoine forestier français et suivre son évolution dans le temps, l'IGN a développé son propre modèle de fondation IA. Reversé en open source, celui-ci exploite les images satellite et aériennes avec une dimension temporelle.

PublicitéIl y a deux ans, l'Institut national de l'information géographique et forestière (IGN) a cherché un moyen d'exploiter plus finement les images satellite et les vues aériennes à sa disposition. Une démarche qui répond en particulier à sa mission la plus récente en 85 ans d'existence : la cartographie des forêts françaises. Des modèles sur étagère existent pour répondre à de tels besoins, mais, pour l'Institut, ils manquent de précision et, surtout, d'une 4e dimension. La forêt évolue en effet au fil des saisons et le modèle choisi doit aussi intégrer des séries temporelles.

En 2024, l'IGN a donc préféré se lancer dans le développement de son propre modèle de fondation IA. Le projet appelé Maestro correspond qui plus est aux valeurs d'indépendance et de souveraineté propres à sa mission de cartographie du territoire national. Pour cette raison, l'Institut dispose déjà de ses propres avions pour les prises de vue aériennes et de trois datacenters en propre. Il a aussi investi dans des clusters de GPU au moment de l'explosion de la GenAI [avant Maestro, NDLR], pour réaliser des entraînements. Il va donc désormais également disposer de son propre modèle de fondation de machine learning pour le traitement des images satellite et aériennes.

Des modèles existants trop imprécis

« Les modèles de fondation géographiques [GFM, geographical foundation model] sont plus petits que les modèles de fondation texte comme ceux de Mistral ou OpenAI, décrit Charles-Pierre Astolfi, DSI de l'IGN, pour expliquer l'insuffisante précision de ces systèmes dans le cadre de son projet. Ils sont moins soumis à la pression économique et s'appuient seulement sur quelques centaines de millions de paramètres contre des centaines de milliards pour les modèles de fondation texte. » De plus, les GFM sont très variés, selon le DSI, entraînés indifféremment avec des photos satellite, des images aériennes, des clichés infrarouges, du RVB (rouge vert bleu) ou encore des images radar. « Il existe plusieurs façons d'observer un point de la Terre », résume Charles-Pierre Astolfi. « Et souvent, les modèles open source disponibles sont uniquement entrainés dans le spectre du visible ».

Maestro vise à développer un modèle de fondation géographique entraîné sur des bases de photos aériennes et satellitaires de l'IGN, et qui plus est, des séries temporelles de données. Ce modèle doit apprendre à créer les liens entre temps et espace, afin d'obtenir une continuité dans le temps. Il répond en effet en priorité à un objectif : la publication en 2026 de la 3e version de la base de données des forêts françaises. « Cette version sera complètement basée sur l'utilisation du modèle d'IA, précise le DSI de l'IGN. Nous avons donc spécialisé celui-ci pour cette tâche spécifique avec, par exemple, le repérage des différentes espèces d'arbres. » Par ailleurs, l'IGN a bien entendu réfléchi à ce qui, dans ce projet, pourrait être utile à ses missions, à la base de données des forêts, mais aussi à ce qui pourrait être utile à d'autres. « Dès le départ, notre idée a été de produire un commun numérique et de reverser librement le modèle en open source », insiste Charles-Pierre Astolfi.

PublicitéUne évolution des compétences techniques et d'organisation

Encore en phase de R&D, Maestro est néanmoins bien un projet destiné à la production, et non un POC. Il est donc aussi l'occasion de développer des processus de conception de ce type d'outils propres à l'IGN. « On parle bien sûr de la compétence technique de nos ingénieurs », précise le DSI, « auxquels on va donner des centaines de gigaoctets de données avant de leur demander de créer un modèle de fondation. Mais on parle aussi de toute la compétence organisationnelle en matière d'intégration du modèle dans nos chaînes de production ou de mesure de l'utilité réelle pour les différents produits de l'IGN. Cela représente aussi une montée en maturité de l'organisation autour de l'intelligence artificielle. Ce n'est vraiment pas qu'un sujet technique, même si le modèle est, lui, très technique. »

Pour le DSI, ce sont en particulier les compétences d'entraînement du modèle qui ont changé. « Faire tourner des GPU, entraîner des modèles sur des GPU ou prendre des modèles et les intégrer dans une chaîne de production, ce sont vraiment des métiers assez différents. » Pour travailler sur ces modèles, la DSI de l'IGN dispose de 35 ingénieurs IA sur un effectif de 200 personnes. Avec une centaine de développeurs, ils sont au service des missions de l'IGN et de ses 1537 agents, ou des autres services publics.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis