Le virage IA de Microsoft prend une tournure beaucoup plus offensive. Sept modèles frontières MAI, deux modèles locaux Aion, du tuning maison et de l’exécution locale dans Windows dessinent une ambition très claire : devenir un fournisseur de modèles frontières à part entière. OpenAI, Anthropic et Google peuvent commencer à s’inquiéter…

Longtemps cantonné au rôle de distributeur des modèles d’OpenAI, Microsoft change de braquet. Depuis la renégociation de septembre 2025 qui l’a libéré de l’interdiction contractuelle de poursuivre seul l’AGI, l’éditeur a les coudées franches pour bâtir ses propres modèles de pointe. Et il ne s’en prive plus. Après le trio inaugural d’avril (Transcribe-1, Voice-1, Image-2), Mustafa Suleyman, le patron de Microsoft AI a dévoilé durant la conférence Build 2026, une famille entière : sept nouveaux modèles MAI conçus de bout en bout en interne couvrant le raisonnement, le code, l’image, la transcription et la voix. Microsoft entend désormais peser directement sur le terrain des modèles frontières, avec ses propres briques, ses propres données, son propre silicium (Maia 200 qui dope l’exécution de ces modèles) et sa propre stratégie de distribution.

Une famille multimodale, sans distillation

Désormais, à l’instar d’OpenAI ou Google, Microsoft dispose d’une famille complète de modèles à l’état de l’art de la technologie : 5 catégories dont deux déclinées en variantes « Flash », soit sept modèles au total.

MAI-Thinking-1 sert de vaisseau amiral du LLM à raisonnement : un modèle de taille moyenne qui se hisse en tête de sa catégorie sur les benchmarks d’ingénierie logicielle et atteint, en évaluations comparatives à l’aveugle, la parité de préférence humaine avec Sonnet 4.6.

MAI-Code-1-Flash (5 milliards de paramètres) vise le codage agentique, profondément intégré à GitHub Copilot et VS Code, comparable à Haiku en terme de performance mais en moins cher.

MAI-Image-2.5 et sa variante Flash couvrent génération et édition d’images, et se classent désormais n°2 sur l’Arena pour l’édition d’images, devant Nano Banana Pro ! Le modèle est déjà actif dans PowerPoint et en cours de déploiement dans OneDrive.

MAI-Transcribe-1.5 est revendiqué comme le meilleur modèle de transcription au monde : précision à l’état de l’art, cinq fois plus rapide que la concurrence, terminologie métier prise en charge sur 43 langues. Annoncé comme 5,7 fois plus rapide que la concurrence, son prix est fixé à 0,36 dollar par heure d’audio. Un positionnement agressif qui en dit long sur les ambitions de Microsoft.

Enfin, MAI-Voice-2 (variante Flash à venir) synthétise une voix naturelle en 15 langues à partir d’un court échantillon (d’autres langues arrivent).

Et Microsoft insiste sur un entraînement « depuis le bas de la colline », sans distillation de modèles tiers (un pied de nez aux modèles Chinois ?), sur des données propres et sous licence (pour éviter tout risque juridique), avec un co-design sur silicium maison Maia 200 (et un gain d’efficacité de 1,4x).

Mieux encore, tous ces modèles vont bénéficier via Microsoft Foundry d’une fonction « Frontier Tuning », qui permet aux entreprises d’affiner un modèle MAI sur leurs propres flux de travail via des environnements d’apprentissage par renforcement. L’argument économique fait mouche : un MAI ajusté pour Excel égalerait GPT 5.4 pour une efficacité jusqu’à 10 fois supérieure !

Aion : l’intelligence qui descend dans le PC

En parallèle, Build 2026 a vu naître deux nouveaux modèles « Aion » destinés à l’exécution locale sous Windows. Aion 1.0 Instruct est un petit modèle de langage taillé pour les tâches de texte du quotidien – résumé, réécriture, détection d’intention, accessibilité – disponible dès maintenant en préversion. Aion 1.0 Plan, plus ambitieux, est un modèle de raisonnement et d’appel d’outils de 14 milliards de paramètres (fenêtre de 32K) qui s’embarquera directement dans Windows sur les machines compatibles, pour orchestrer des agents entièrement en local, sans aller-retour vers le cloud.

Comment y accéder dès aujourd’hui

Les modèles MAI sont distribués via Azure Foundry, optimisés pour les produits maison (Copilot en tête) et, fait nouveau, largement ouverts aux développeurs sur OpenRouter, Fireworks et Baseten avec, pour la première fois, la possibilité d’ajuster soi-même les poids. Un terrain de jeu est accessible sur playground.microsoft.ai (avec certaines limitations territoriales néanmoins).
Côté Aion, Instruct se teste immédiatement dans les canaux Edge Canary et Dev, ses poids ouverts étant attendus sur Hugging Face en juillet ; Plan, lui, arrivera « dans les prochains mois » directement embarqué dans Windows 11.

Performance crédible, tarification agressive, ouverture aux développeurs et désormais exécution locale : Microsoft ne se contente plus de revendre l’intelligence d’autrui. Sur le terrain des modèles frontières, l’éditeur est en train de s’imposer en à peine quelques mois comme un acteur majeur qui compte désormais dans le paysage des modèles IA pour les entreprises.

 

____________________________

À lire également :

Microsoft Scout : le premier « Autopilot » de Microsoft carbure à OpenClaw

Project Solara : Microsoft s’invite dans l’ère des objets agentiques

MAI-Image-2.5 : Microsoft commence à prendre la pose

Microsoft déploie trois modèles MAI maison : transcription, voix et image au programme

Microsoft MAI-DxO et Google AlphaGenome préfigurent une nouvelle ère des soins

Microsoft veut toujours faire de Windows un OS agentique, mais sans refaire les mêmes erreurs