Anthropic teste les puces Maia d’Azure pour Claude

L’IA générative n’est plus seulement une course aux modèles. C’est aussi devenu une course à l’accès au calcul. Anthropic en donne une nouvelle illustration : l’éditeur de Claude discuterait avec Microsoft pour louer de la capacité serveur reposant sur les NPU « Maia », les accélérateurs IA maison d’Azure. Les discussions seraient encore préliminaires et aucun accord n’aurait été finalisé, mais elles confirment une tendance lourde : pour les grands laboratoires d’IA, sécuriser le compute devient aussi stratégique que concevoir les modèles.

Anthropic cherche de la puissance de calcul partout où elle peut en trouver. Quitte à devoir adapter ses algorithmes et ses codes sources à des architectures GPU autres que celles de NVidia. Et la jeune pousse de l’IA (qui prépare une IPO probablement en Septembre) n’en est plus à l’expérimentation. On peut même dire qu’elle n’avance pas en terrain inconnu. La société s’appuie déjà sur plusieurs grands fournisseurs cloud. Elle a renforcé ses liens avec Google Cloud et ses TPU, tout en étendant parallèlement son usage d’AWS autour des puces Trainium3.

Mais la jeune pousse séduit aussi Microsoft qui a commencé à embarquer Claude (en plus de GPT-5.5) dans plusieurs services y compris Copilot for Microsoft 365. Le géant américain est désormais entré dans les équations d’Anthropic avec un engagement financier de 5 milliards de dollars et un accord par lequel Anthropic s’engage à consommer 30 milliards de dollars de services Azure.
Et quitte à consommer de la puissance de calcul sur Azure pourquoi ne pas tirer profit des accélérateurs de la maison Cloud de Microsoft, alors que ces derniers animent bien des IA du géant américain notamment celles embarquées par BING.Le recours éventuel à Maia ajouterait donc une brique de plus à une stratégie clairement multi-cloud et multi-accélérateurs.

Le compute devient le nerf de la guerre

Cette diversification de fournisseurs de calculs répond à un problème simple : la demande explose plus vite que la capacité disponible. Entraîner les prochains modèles exige des grappes massives d’accélérateurs. Mais l’inférence, c’est-à-dire l’exécution quotidienne des modèles pour servir les utilisateurs, devient, elle aussi, un gouffre économique. C’est même désormais le principal gouffre, le nerf de la guerre.
Plus Claude Code et les usages professionnels agentiques de Claude progressent (avec notamment Claude Cowork), plus Anthropic doit trouver des processeurs capables de délivrer beaucoup de jetons à coût maîtrisé. Dans ce contexte, la dépendance aux seuls GPU Nvidia devient un risque industriel, financier et opérationnel.

C’est précisément là qu’entre en scène la puce Maia-200 de Microsoft. Optimisée pour l’inférence IA à grande échelle, elle serait l’une des armes clés de l’hyperscaler pour réduire les coûts au token. Gravée en 3 nm chez TSMC, elle embarque 216 Go de mémoire HBM3e, une bande passante de 7 To/s, 272 Mo de mémoire SRAM intégrée et des cœurs de calcul FP4/FP8 adaptés aux formats de précision réduite utilisés pour générer des tokens efficacement. Microsoft revendique plus de 10 pétaflops en FP4, plus de 5 pétaflops en FP8 et 30 % de performance par dollar supplémentaire par rapport au matériel le plus récent de sa flotte.

Maia, un pari silicium pour Azure

L’intérêt pour Anthropic est donc évident. Maia ne remplacerait pas les TPU de Google, Trainium3 d’AWS ou les GPU Nvidia. Elle offrirait plutôt une option supplémentaire pour absorber la montée en charge de Claude, réduire les goulets d’étranglement et arbitrer entre coût, disponibilité et performance.
Et, pour Microsoft, convaincre Anthropic constituerait une validation importante de sa stratégie silicium : Azure ne veut plus seulement louer des GPU, mais proposer son propre socle d’inférence optimisé. On rappellera que l’hyperscaler a déployé non seulement des accélérateurs IA maison (avec les Maia-100 et Maia-200) mais aussi des CPU optimisé pour l’IA (avec les Cobalt-100 et Cobalt-200).

Reste deux inconnues majeures : le coût d’adaptation et la disponibilité réelle. Pour fonctionner sur Maia-200, Anthropic va devoir adapter ses plateformes IA à l’architecture d’Azure et de l’accélérateur. Un effort de portage qui a un coût. Anthropic est justement en train de vérifier que l’effort en vaut la chandelle. Par ailleurs, Maia-200 fonctionne pour l’instant dans la seule région Azure US Central, avec un déploiement prévu ensuite en US West 3, mais la puce n’est pas encore proposée comme une ressource Azure largement accessible. Microsoft sert jusqu’ici en priorité ses propres besoins avec Cobalt et Maia, pas encore ceux de ses clients Azure. Mais avec des partenaires comme Anthropic, les frontières ne peuvent qu’évoluer.

Reste qu’à l’ère des modèles géants et des usages massifs de l’IA agentique, ce n’est plus l’algorithme qui fait la loi, c’est l’accès au silicium. Claude n’a plus un fournisseur : il a un appétit. Féroce. Et il semble bien désormais chercher à dévorer tout ce qui calcule.

____________________________

Anthropic lorgne sur les puces Maia d’Azure pour nourrir Claude en compute

Le compute devient le nerf de la guerre

Maia, un pari silicium pour Azure

À lire également :

Microsoft dégaine le Maia-200, son nouvel accélérateur IA maison

Cobalt‑200 : Microsoft annonce son second processeur maison, avec 132 cœurs Arm

Anthropic s’offre Stainless, la plomberie discrète de l’IA agentique

Claude Design : Anthropic s’invite dans le design collaboratif dopé à l’IA agentique

Claude Opus 4.7 : Anthropic muscle son modèle phare, mais garde Mythos sous clé

TPU 8t et 8i : Google dégaine deux puces IA pour dompter l’ère des agents

84 % de capacité GPU gaspillée : pourquoi l’IA est un défi d’orchestration, pas de puissance…

InfiormatiqueNews.fr

Rajouter InformatiqueNews.fr sur votre écran d'accueil