À l’occasion de Microsoft Ignite 2023, Microsoft a officialisé l’arrivée de ses propres processeurs sur son cloud pour vitaminer ses IA…

Nous en parlions déjà en avril dernier. Cette fois c’est officiel. Microsoft a bien développé ses propres processeurs afin de réduire les coûts et améliorer les performances de ses IA et de celles d’OpenAI : Ils s’appellent Maia 100 et Cobalt 100.

Maia, un premier accélérateur IA

À l’heure où le prix des GPU flambe pendant que leur indisponibilité sur le marché s’accroit, Microsoft n’hésite pas à venir titiller Intel, AMD et plus encore NVidia sur le sujet clé du moment : comment booster les IA génératives tout en réduisant le coût de leurs apprentissages comme de leurs inférences.

Microsoft avait déjà développé ses propres FPGA pour l’IA et équipé certaines de ses machines Azure avec. Mais l’IA a aujourd’hui pris une telle emprise sur ses infrastructures qu’il était économiquement plus rentable de développer sa propre puce. Notons que Google Cloud avec la même chose depuis longtemps avec ses TPU (déjà en génération 5) ainsi qu’AWS avec ses puces Trainium et Inferentia 2.

Maia 100 est la première génération d’une série d’accélérateurs IA créés spécifiquement par Microsoft pour le hardware Azure et pour booster les modèles Copilot et OpenAI. Selon Microsoft, avec plus de 100 milliards de transistors, c’est l’une des plus grandes puces jamais construites en technologie 5 nm. Elle doit permettre non seulement d’accélérer les Workloads IA mais aussi de les rendre moins énergivores puisque le processeur a été construit en ce sens.

Cobalt 100, le CPU ARM signé Microsoft

C’est aussi pour optimiser la performance par Watt des machines que Microsoft a développé son propre processeur à architecture ARM. Objectif, réduire le coût des machines soutenant un certain nombre de Workloads Microsoft (Teams, Azure SQL, Microsoft 365…) tout en réduisant la facture énergétique et l’empreinte carbone.

Le Cobalt 100, qui se veut la première génération des CPU « Azure » signés Microsoft, est un processeur 64 bits embarquant 128 cœurs. Sa conception originale orientée sur l’économie d’énergie en ferait selon l’hyperscaler un CPU « 40% plus efficient que les actuelles machines ARM d’Azure ». Un coup dur pour Ampere qui jusqu’ici fournissait Microsoft en processeurs ARM.

« Dans cette nouvelle ère de l’IA, nous redéfinissons l’infrastructure cloud, du silicium aux systèmes, pour préparer l’IA dans chaque entreprise, dans chaque application, pour tout le monde » justifie Omar Khan, directeur général de Microsoft.

