L’IA générative n’est plus seulement une course aux modèles. C’est aussi devenu une course à l’accès au calcul. Anthropic en donne une nouvelle illustration : l’éditeur de Claude discuterait avec Microsoft pour louer de la capacité serveur reposant sur les NPU « Maia », les accélérateurs IA maison d’Azure. Les discussions seraient encore préliminaires et aucun accord n’aurait été finalisé, mais elles confirment une tendance lourde : pour les grands laboratoires d’IA, sécuriser le compute devient aussi stratégique que concevoir les modèles.
Anthropic cherche de la puissance de calcul partout où elle peut en trouver. Quitte à devoir adapter ses algorithmes et ses codes sources à des architectures GPU autres que celles de NVidia. Et la jeune pousse de l’IA (qui prépare une IPO probablement en Septembre) n’en est plus à l’expérimentation. On peut même dire qu’elle n’avance pas en terrain inconnu. La société s’appuie déjà sur plusieurs grands fournisseurs cloud. Elle a renforcé ses liens avec Google Cloud et ses TPU, tout en étendant parallèlement son usage d’AWS autour des puces Trainium3.
Mais la jeune pousse séduit aussi Microsoft qui a commencé à embarquer Claude (en plus de GPT-5.5) dans plusieurs services y compris Copilot for Microsoft 365. Le géant américain est désormais entré dans les équations d’Anthropic avec un engagement financier de 5 milliards de dollars et un accord par lequel Anthropic s’engage à consommer 30 milliards de dollars de services Azure.
Et quitte à consommer de la puissance de calcul sur Azure pourquoi ne pas tirer profit des accélérateurs de la maison Cloud de Microsoft, alors que ces derniers animent bien des IA du géant américain notamment celles embarquées par BING.Le recours éventuel à Maia ajouterait donc une brique de plus à une stratégie clairement multi-cloud et multi-accélérateurs.
Le compute devient le nerf de la guerre
Cette diversification de fournisseurs de calculs répond à un problème simple : la demande explose plus vite que la capacité disponible. Entraîner les prochains modèles exige des grappes massives d’accélérateurs. Mais l’inférence, c’est-à-dire l’exécution quotidienne des modèles pour servir les utilisateurs, devient, elle aussi, un gouffre économique. C’est même désormais le principal gouffre, le nerf de la guerre.
Plus Claude Code et les usages professionnels agentiques de Claude progressent (avec notamment Claude Cowork), plus Anthropic doit trouver des processeurs capables de délivrer beaucoup de jetons à coût maîtrisé. Dans ce contexte, la dépendance aux seuls GPU Nvidia devient un risque industriel, financier et opérationnel.

Maia, un pari silicium pour Azure
L’intérêt pour Anthropic est donc évident. Maia ne remplacerait pas les TPU de Google, Trainium3 d’AWS ou les GPU Nvidia. Elle offrirait plutôt une option supplémentaire pour absorber la montée en charge de Claude, réduire les goulets d’étranglement et arbitrer entre coût, disponibilité et performance.
Et, pour Microsoft, convaincre Anthropic constituerait une validation importante de sa stratégie silicium : Azure ne veut plus seulement louer des GPU, mais proposer son propre socle d’inférence optimisé. On rappellera que l’hyperscaler a déployé non seulement des accélérateurs IA maison (avec les Maia-100 et Maia-200) mais aussi des CPU optimisé pour l’IA (avec les Cobalt-100 et Cobalt-200).
Reste deux inconnues majeures : le coût d’adaptation et la disponibilité réelle. Pour fonctionner sur Maia-200, Anthropic va devoir adapter ses plateformes IA à l’architecture d’Azure et de l’accélérateur. Un effort de portage qui a un coût. Anthropic est justement en train de vérifier que l’effort en vaut la chandelle. Par ailleurs, Maia-200 fonctionne pour l’instant dans la seule région Azure US Central, avec un déploiement prévu ensuite en US West 3, mais la puce n’est pas encore proposée comme une ressource Azure largement accessible. Microsoft sert jusqu’ici en priorité ses propres besoins avec Cobalt et Maia, pas encore ceux de ses clients Azure. Mais avec des partenaires comme Anthropic, les frontières ne peuvent qu’évoluer.
Reste qu’à l’ère des modèles géants et des usages massifs de l’IA agentique, ce n’est plus l’algorithme qui fait la loi, c’est l’accès au silicium. Claude n’a plus un fournisseur : il a un appétit. Féroce. Et il semble bien désormais chercher à dévorer tout ce qui calcule.
____________________________

puis