Avec son « Agents API », Mistral AI fait passer l’IA générative du simple texte à l’action : exécution de code, recherche Web, génération d’images et mémoire persistante s’imbriquent désormais dans un même cadre gouvernable. De quoi inscrire la startup dans l’ère agentique et lui permettre de ne pas se laisser distancer par les leaders américains.
Quand on s’appelle Mistral AI, pépite parisienne fondée en 2023 par trois anciens chercheurs de DeepMind et Meta, et que l’on sert de fleuron à toute la Tech IA Européenne, on ne peut se permettre de ralentir et l’on se doit d’innover vite. En moins de deux ans, l’éditeur a su se hisser parmi les références du deep learning européen grâce à ses modèles de langage ouverts et performants mais aussi grâce à un intense rythme d’innovations et de nouveautés.
Alors que les Agents IA ont été les grandes stars des méga shows américains de Google (Google I/O 2025) et de Microsoft (Build 2025), Mistral AI se devait de réagir et démontrer ses capacités à exister et défendre les couleurs européennes à l’ère agentique.
Avec sa nouvelle interface « Agents API », Mistral AI veut permettre aux entreprises de confier de vraies tâches à des agents autonomes, capables d’enchaîner actions et décisions au fil d’une même conversation .
Plus qu’une API, un cadre d’exécution complet
Pensé comme le pendant « actionnable » de l’actuelle Chat Completion, l’Agents API réunit quatre piliers :
1- Des connecteurs natifs préconçus : dans un même appel, un agent peut exécuter du Python en bac à sable, interroger le Web, puiser dans une bibliothèque documentaire ou générer des visuels via le moteur Black Forest Lab FLUX 1.1 [pro] Ultra.
2- Le support de MCP : Mistral AI rejoint Microsoft, OpenAI, Google et IBM dans l’adoption du protocole de connexion aux sources de données créé par Anthropic. Le support du Model Context Protocol (MCP) permet une intégration transparente avec les systèmes d’information existants, qu’il s’agisse de bases de données, d’APIs métier ou d’outils collaboratifs comme GitHub ou Linear.
3- Une mémoire persistante : chaque conversation reste contextualisée, évitant aux développeurs de gérer manuellement l’historique et ouvrant la voie à des assistants long terme.
4- Une orchestration dynamique : Contrairement aux approches monolithiques, Mistral permet de créer des workflows où plusieurs agents spécialisés collaborent pour résoudre des problèmes complexes. Un agent financier peut ainsi déléguer des tâches de recherche à un agent web, qui lui-même sollicitera un agent calculateur pour des analyses quantitatives. Cette approche modulaire facilite grandement la maintenance et l’évolution des systèmes, tout en garantissant une meilleure répartition des charges de travail.
Des cas d’usage pour transformer les métiers
Les benchmarks publiés par Mistral illustrent l’impact concret de cette approche. Sur le test SimpleQA, les modèles Mistral Large et Medium équipés de la recherche web atteignent respectivement 75% et 82,32% de précision, contre seulement 23% et 22,08% sans cette fonctionnalité. Ces chiffres démontrent l’importance cruciale de connecter les modèles d’IA aux sources d’information en temps réel.
Au-delà de la théorie, Mistral publie plusieurs cookbooks illustrant la mise en œuvre : un assistant de développement pilotant GitHub et DevStral, un coordinateur de tickets Linear, un analyste financier multipliant les appels d’API, ou encore un conseiller voyage qui réserve hôtels et vols en temps réel . De quoi inspirer les équipes projet des DSI.
En concentrant exécution, mémoire, gouvernance et sécurité dans une seule API, Mistral répond aux deux questions récurrentes des responsables IT : comment passer à l’échelle et comment garder le contrôle. L’Agents API offre un point d’entrée unique, journalisé et maîtrisable, compatible avec les politiques de conformité et les exigences de traçabilité des DSI et RSSI. Comme le résume le CEO de Mistral AI, Arthur Mensch : « Avec Agents API, nous voulons fournir un cadre fiable pour que l’IA résolve des problèmes concrets, pas seulement des phrases. »
Codestral embed, parce qu’en Dev, il n’y a pas que la génération de code
Mistral AI démontre une nouvelle fois son dynamisme. Parallèlement à la sortie de son « Agents API », la jeune pousse française annonce un nouveau modèle.
Depuis 1 an, Mistral AI se fait remarquer du côté de la génération de code et joue le rôle de référence du marché avec son modèle open-weight « Codestral ». L’entreprise ajoute aujourd’hui une brique clé : Codestral Embed, un modèle d’« embeddings » spécialisé qui traduit fichiers sources, docstrings ou requêtes SQL en vecteurs comparables. Avec pour les DSI un triple objectif : accélérer la recherche contextuelle, maîtriser les coûts d’inférence et réduire les risques de doublons ou de licences non conformes.
Sur les jeux de données SWE-Bench Lite, CodeSearchNet ou Spider, Codestral Embed dépasse les modèles les plus réputés (Voyage Code 3, Cohere Embed v4.0, OpenAI Ada 002) tout en restant compact. Mistral montre qu’une version 256 dimensions en int8 (à peine 0,25 Ko par fragment) peut se montrer plus précise que les modèles concurrents deux fois plus volumineux.
« Même avec le réglage le plus économe, notre embedder garde l’avantage », souligne l’équipe R&D dans la note de publication.
Codestral Embed est pensé pour les usages de l’IA en entreprise tels que la retrieval-augmented generation (RAG), la recherche sémantique, la détection de duplications ou encore l’analyse et clustering, dès lors que ces usages sont exploités dans un contexte d’équipes de développements logiciels.
À lire également :
Dell peaufine sa AI Factory 2.0 et adopte Mistral AI
Mistral lance un nouveau modèle Medium 3 et annonce Le Chat en version Entreprise
Mistral Small 3.1 : petit, multimodal, multilingue, il fait de l’ombre aux géants
Mistral AI : Une app mobile pour Le Chat et un datacenter pour ses IA
Mistral AI s’allie à l’AFP
Google I/O 2025 (1/2) : une armée d’IA multimodales pour réinventer le monde numérique
Google I/O ’25 (2/2) : Des agents à la réalité mixte…
BUILD 2025 (1/4) : L’agentification du travail selon Microsoft
BUILD 2025 (2/4) : Des usines à agents IA
BUILD 2025 (3/4) : Dev, Ops, Sécurité et conformité à l’ère agentique
BUILD 2025 (4/4) : Windows se réinvente pour l’ère de l’IA agentique