Neuf types de données, un seul cerveau IA : TerraMind casse les silos de l’analyse géospatiale pour mieux cartographier notre planète, sans exploser les compteurs carbone. Pensé pour être malin et léger, ce modèle IA voit la Terre sous tous ses angles, sans avoir besoin d’un supercalculateur à chaque inférence, afin de nous permettre de mieux l’observer et de mieux la comprendre.

Décidément, les chercheurs en IA tentent de trouver des usages très « nature » à leurs IA sur-consommatrices d’énergie et néfastes aux efforts de réduction des émissions de CO2. Hier nous vous parlions des efforts de Google DeepMind pour décoder le langage des dauphins avec son modèle ouvert DolphinGemma.

Aujourd’hui, l’Agence spatiale européenne (ESA) et IBM annoncent la publication en open source de TerraMind, un modèle d’intelligence artificielle générative multimodale destiné à l’analyse géospatiale et l’observation avancée de la Terre et de ses écosystèmes !

Conçu avec le concours de KP Labs, du Jülich Supercomputing Centre et de la DLR, TerraMind s’appuie sur neuf modalités de données — images satellites, séries climatiques, cartes de végétation ou encore relevés topographiques — pour croiser des informations hétérogènes et en extraire des corrélations fines.

Performances et méthodologie

Évalué par l’ESA sur le benchmark communautaire PANGAEA, TerraMind surpasse douze modèles de référence et améliore la précision moyenne d’au moins 8 % sur des tâches opérationnelles, telles que la classification de couverture terrestre, la détection de changements ou l’analyse multi-capteurs. Cette efficacité découle en partie de l’architecture encodeur-décodeur symétrique, optimisée pour traiter indifféremment pixels, jetons textuels et séquences temporelles, tout en limitant la charge de calcul : selon IBM, l’inférence requiert dix fois moins de ressources que les approches classiques à périmètre équivalent.

Entraînement et réduction des biais

Le modèle a été pré-entraîné sur TerraMesh, un corpus de neuf millions d’échantillons couvrant tous les biomes et usages des sols. Cette diversité vise à minimiser les biais régionaux et à garantir une transférabilité globale. Pour Johannes Jakubik, chercheur chez IBM Research Zürich, la clé réside dans le réglage « Thinking-in-Modalities » : « Le modèle s’auto-génère des données d’apprentissage pertinentes pour le cas analysé, par exemple en lui demandant de “penser” à l’occupation des sols lorsqu’il cartographie les plans d’eau ». Cette génération synthétique accroît l’efficacité du fine-tuning sans consommation supplémentaire de jeux de données réels.

Une IA qui connaît la Terre mieux que nous

Juan Bernabé-Moreno, directeur d’IBM Research UK & Ireland, résume l’enjeu : « TerraMind va au-delà du traitement d’images : il possède une compréhension intuitive des données géospatiales et de notre planète ».

TerraMind prolonge ainsi la lignée des modèles Prithvi développés par IBM et la NASA en 2023, dont il hérite la capacité à tourner sur des infrastructures réduites. Déjà disponibles sur Hugging Face, des versions spécialisées seront publiées dans les mois à venir. L’ouverture du code répond à la stratégie Open Science de la NASA et à l’initiative de l’ESA visant à démocratiser les fondations d’IA pour l’observation planétaire.

TerraMind apporte ainsi un cadre IA unifié pour des applications critiques liées aux différentes formes d’observation de la Terre : suivi des infrastructures terrestres, prédiction du stress hydrique, surveillance de la biodiversité ou gestion des risques climatiques. Sa légèreté du modèle facilite un déploiement on-premise, limitant l’exposition d’éventuelles données sensibles aux clouds publics.

 

À lire également :

Evo-2 : Le plus grand modèle d’IA en biologie

OpenAI lance ses modèles « o3 » et « o4-mini », des IA douées pour analyser les images, réfléchir et programmer

IBM et Pasqal : « Le quantique a déjà quitté le laboratoire… Aujourd’hui, on a des clients… »

IBM lance son nouveau mainframe, le z17, bâti pour l’ère de l’IA !