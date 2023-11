Microsoft et Oracle ne cesse de multiplier les partenariats. Face à la consommation massive de GPU des IA en pleine la pénurie de composants, Microsoft est contraint d’aller louer de la ressource ailleurs pour libérer de la charge sur ses propres infrastructures (afin de poursuivre ses recherches et apprentissages des IA) et booster les capacités et la réactivité de Bing Chat.

Depuis sa naissance, il y a à peine neuf mois, Bing Chat a engagé plus de 1,9 milliard de discussions avec les internautes. Des discussions qui non seulement se multiplient chaque jour un peu plus mais se complexifient aussi avec l’intégration de nouvelles capacités comme la génération d’images et de tableaux Excel.

Entre ses propres IA (Bing Chat, Bing Chat Entreprise, Microsoft Copilot, Microsoft 365 Copilot, Dynamics 365 Copilot, Security Copilot…), ses IA “Azure” (OpenAI Services, Azure AI Services, Azure Copilot,… ) et celles d’OpenAI hébergées sur ses infrastructures, Microsoft est en quête de ressources supplémentaires et notamment de GPU. Une denrée devenue extrêmement rare et coûteuse. Sans compter qu’OpenAI, Microsoft et leurs clients ont aussi besoin de ressources massives pour entraîner les futures IA et non uniquement pour inférer celles existantes.

Apparemment, la rareté des ressources encourage désormais Microsoft à aller en louer ailleurs. Microsoft et Oracle viennent en effet de signer un nouveau partenariat permettant à la firme de Redmond d’aller louer avantageusement de la ressource GPU sur Oracle Cloud Infrastructure.

Les deux entreprises ont, ces dernières années, signé des partenariats forts. Le dernier en date voyait d’ailleurs Oracle Cloud déployer OCI dans les datacenters Azure pour mieux servir leurs clients communs. Un partenariat qui a débuté une forte interconnectivité entre leurs deux Clouds. Ces d’ailleurs cette dernière qui facilite et sert d’épine dorsale au déploiement des IA Bing sur OCI.

Plus concrètement, ce partenariat permet à Microsoft de faire déborder sur OCI les workloads d’inférence IA de Bing Chat normalement hébergés sur Azure. La firme dirigée par Satya Nadella exploitera notamment les instances « Bare Metal » d’OCI Compute au sein de clusters RDMA basse latence. De tels clusters sur OCI peuvent combiner jusqu’à 4096 instances bare-metal pour offrir jusqu’à 32768 GPU NVidia A100 ou 16384 GPU NVidia H100 ainsi que des pétaoctets de stockage réparti.

Grâce à Oracle Interconnect for Azure et Azure ARC, Microsoft peut aisément orchestré Azure Kubernetes Service (AKS) sur OCI.

Divya Kumar, responsable marketing mondial pour la recherche et l’IA chez Microsoft explique ainsi que « Microsoft Bing s’appuie sur les dernières avancées en matière d’IA pour offrir une expérience de recherche nettement meilleure aux internautes du monde entier. Notre collaboration avec Oracle et l’utilisation de l’infrastructure cloud d’Oracle avec notre infrastructure d’IA Microsoft Azure, élargira l’accès aux clients et améliorera la vitesse de beaucoup de nos résultats de recherche ».

Sans surprise, les détails financiers de ce partenariat n’ont pas été dévoilés.

