Mistral AI publie son empreinte environnementale, bien reçue malgré ses lacunes

Mistral AI a publié le 22 juillet des chiffres sur son empreinte environnementale ainsi que des constats et propositions pour améliorer la précision des rapports sur l'impact de la genAI. Cette première pour un éditeur de genAI soulève à la fois un grand intérêt et de nombreuses critiques face à ses lacunes, dont l'absence remarquée de méthodologie détaillée.
Publicité« Bel effort, mais peut mieux faire ». C'est ainsi que l'on pourrait résumer la réaction qui a accueilli le 22 juillet le billet de Mistral AI reprenant certains résultats et certaines conclusions de l'analyse de cycle de vie (ACV) de son LLM. Un texte qui liste aussi des constats et des propositions pour améliorer la précision des rapports disponibles sur l'empreinte environnementale de la genAI. Pour beaucoup, les experts de la green AI, les prestataires, mais aussi les DSI saluent les efforts de transparence du Français qui laisse espérer en particulier que d'autres suivront son exemple. Il faut dire que le silence du secteur de la genAI sur son empreinte est assourdissant, malgré la croissance exponentielle du nombre de ses datacenters et de leur consommation d'énergie, d'eau et de métaux rares. Et ce, même si les rapports sur le développement durable récents des géants du cloud (Microsoft Azure ou GCP, par exemple) montrent l'explosion de leurs émissions de GES (gaz à effets de serre), que tous attribuent - sans plus de détails - directement à leurs activités de genIA. Aucun d'entre eux, pas plus qu'Anthropic, OpenAI, Deepseek ou X, ne se donne cependant la peine de publier des rapports RSE de leurs LLM.
Une analyse du cycle de vie en 7 étapes
Plus qu'un simple bilan carbone, Mistral AI a réalisé en janvier dernier une analyse du cycle de vie (ACV) de son modèle Large 2 à partir des données de son année et demie d'activité, et il en partage certains résultats. Il décompose son cycle de vie en 7 étapes depuis la conception du modèle jusqu'à son utilisation, et pour chacune d'elles - sauf la dernière - il affiche la part d'émissions de GES, de consommation d'eau et de ressources minérales. 3 indicateurs particulièrement élevés confirment des constats intuitifs sur la genAI. Le matériel représente ainsi 61% de « la consommation de ressources minérales » de l'activité. Et sans surprise, les phases d'entraînement et d'inférence explosent les compteurs avec 85,5% des émissions de GES et 91% de la consommation d'eau.
« Je regrette cependant que les conclusions de Mistral AI mélangent de façon étonnante dans une seule phase de l'ACV, deux étapes distinctes du processus aux impacts très différents : l'entraînement et l'utilisation du LLM, avoue Clément Marche, DG fondateur de la société de service et de conseil en transformation numérique durable Nuageo. Même si la première a une empreinte bien plus importante, elle n'a en général lieu qu'une seule fois, contrairement à l'inférence qui est récurrente une fois le modèle en production, et engendre des volumes d'émission de GES totaux bien plus importants ».
Publicité20,4 kT de CO2 et 281 000 m3 d'eau
Dans sa publication, Mistral AI donne bel et bien des mesures séparées de l'empreinte environnementale de l'entraînement et de celle de l'inférence de Large 2, mais sous la forme d'un bilan global. Pour l'entraînement, elle représente « 20,4 kT CO2e [kilotonnes d'équivalent CO2 d'émissions de GES], 281 000 m3 d'eau consommée et 660 kg Sb eq [kg d'équivalent antimoine, mesure de l'impact sur l'épuisement des ressources abiotiques non renouvelables comme le cuivre, la potasse, les terres rares, etc. en comparaison avec la ressource référente, l'antimoine]. Les impacts marginaux de l'inférence, plus précisément de l'utilisation de l'assistant IA Le Chat [de Mistral AI] pour une réponse de 400 tokens, soit une page de texte [représentent] 1,14 gCO2, 45 ml d'eau et 0,16 mg Sb eq ». Des données qui, si l'on n'en connaît pas la décomposition du calcul, ont le mérite d'être plus détaillée que les mesures assénées sans autre forme de démonstration par le CEO et fondateur d'OpenAI mi-juin. Sam Altman a en effet affirmé sur son blog qu'une requête « moyenne » faite à ChatGPT consomme 0,34 wattheure et 0,32 ml d'eau.
La publication du petit Français de la genAI pèche par de nombreux manques d'informations et de précisions dont la plus importante : l'absence de description de la méthodologie utilisée et des données de base qui ont servi aux calculs de l'empreinte et de l'ACV. C'est d'autant plus dommage que Mistral AI assure avoir réalisé son étude « selon la méthodologie Frugal AI développée par l'Afnor et [que celle-ci] est conforme aux normes internationales, notamment le Green House Gas (GHG) Protocol Product Standard et les normes ISO 14040/44 ». Le Français s'est aussi appuyé sur des partenaires et instances reconnus comme le cabinet de conseil sur les enjeux énergie et climat Carbone 4 et l'Ademe (Agence de la transition écologique), ainsi que sur les cabinets d'audits environnementaux du numérique Resilio et Hubblo.
L'absence de méthodologie détaillée
« Idéalement, nous aurions besoin de bien plus d'informations sur la méthodologie utilisée pour considérer qu'il s'agit d'une ACV formelle, confirme sur Linkedin Sasha Luccioni, AI and climate lead chez Huggingface, car nous avons besoin de connaître les hypothèses formulées et les unités fonctionnelles qui ont servi à l'évaluation ». Qui plus est, Clément Marche s'interroge de son côté sur l'absence apparente de « certaines étapes clés comme la R&D, les pré-tests, le fine-tuning dans l'ACV, alors qu'elles pourraient représenter une part importante de l'impact dans le cycle de vie ». Contacté par la rédaction de CIO sur ce sujet, Mistral AI répond : « tout ce que nous avons à dire est dans notre billet de blog », invoquant en particulier la crainte de dévoiler trop d'informations à la concurrence. Une inquiétude compréhensible, quand cette dernière s'appelle OpenAI, Microsoft, Anthropic, Deepseek, voire X.
Mais l'éditeur français promet aussi dans son billet : « les résultats de notre étude appellent d'autres actions. C'est pourquoi nous nous engageons à mettre à jour nos rapports sur les impacts environnementaux de nos solutions et à participer aux discussions sur le développement de normes industrielles internationales. [...] Les résultats seront prochainement disponibles via la base empreinte de l'Ademe [...] ».
Cahier de doléances
Outre les craintes de se dévoiler à une concurrence féroce, Mistral AI pointe aussi les limites de sa propre étude liées à des obstacles extérieurs. « Cette étude constitue une première approximation puisqu'en l'absence de normes établies pour évaluer l'empreinte environnementale des LLM, se justifie-t-il, il reste difficile d'effectuer des calculs précis. Par exemple, on ne dispose pas à l'heure actuelle d'une étude fiable sur le cycle de vie des GPU. L'impact de leur fabrication n'est donc qu'estimé à ce stade, alors même que cela représente une part significative de l'impact total ». Mistral AI estime aussi que les impacts absolus liés à l'entraînement d'un modèle et ceux marginaux liés à l'inférence pourraient par ailleurs « faire l'objet d'une obligation de reporting à des fins de transparence » et le rapport entre l'impact total de l'inférence et celui de l'ensemble du cycle de vie « pourrait être rendu public sur la base du volontariat ».
Enfin, l'éditeur estime que pour se conformer au GHG protocol product standard, « les futurs audits réalisés dans l'industrie pourraient [utiliser] une approche basée sur la localisation des émissions liées à la consommation d'électricité et incluant tous les impacts significatifs en amont ». Il précise d'ailleurs construire son « propre datacenter en France, en tirant parti d'une électricité bas carbone et d'un climat tempéré pour réduire les émissions de gaz à effet de serre et la consommation d'eau ».
Un premier niveau de réponse pour les DSI
Imparfaite, l'analyse menée par Mistral AI devrait cependant contribuer à répondre à certaines des interrogations des DSI sur les critères environnementaux, lors du choix de leur fournisseur de genAI. En particulier, à l'heure où les organisations doivent répondre de leur propre impact face aux réglementations - même si l'Europe a réduit comme peau de chagrin le périmètre de ses directives CSRD (corporate sustainability reporting directive) et CS3D (corporate sustainability due diligence directive) -, mais aussi à certains de leurs prospects, clients et partenaires. « C'est tout à leur honneur d'ouvrir la voie à plus de transparence, confirme Aurélien Capdecomme. On sait que l'IA est une énorme consommatrice d'énergie - avant et pendant son utilisation - et on a enfin un acteur qui le reconnaît ».
« En tant que CTO de 20 Minutes et citoyen français, affirme enfin Aurélien Capdecomme de 20 Minutes France, il est certain que mes choix se porteront toujours vers des outils transparents, au meilleur mix énergétique et conçus pour limiter les émissions carbone comme la consommation d'eau. Si j'ajoute à cela les questions de souveraineté numérique, la short list se réduit. Maintenant, nous attendons avec impatience la réponse des autres [acteurs du secteur] à ce communiqué ».
Article rédigé par

Emmanuelle Delsol, Journaliste
Suivez l'auteur sur Linked In,
Commentaire
INFORMATION
Vous devez être connecté à votre compte CIO pour poster un commentaire.
Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire