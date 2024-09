Intel a lancé hier soir ses très attendues puces Xeon 6 P et Gaudi 3 en mettant largement en avant leurs applications dans l’univers de l’IA. Pas vraiment de quoi faire trembler l’ultra-domination de NVidia.

Alors qu’il traverse une difficile crise financière et existentielle, amplifiée par l’immense vague de licenciement ainsi que les multiples rumeurs de vente d’activités et de rachats par des concurrents comme Qualcomm, le fondeur Intel annonce le lancement d’un nouveau CPU pour datacenters et d’un nouvel accélérateur d’IA.

« La demande en IA entraîne une transformation massive des datacenters, et l’industrie réclame plus de choix en matière de matériel, de logiciels et d’outils de développement » explique Justin Hotard, vice-président exécutif d’Intel et directeur général de sa division IA. « Avec le lancement de nos processeurs Xeon 6 à cœurs P et de nos accélérateurs d’IA Gaudi 3, Intel favorise un écosystème ouvert permettant à nos clients d’exécuter toutes leurs charges de travail avec une performance, une efficacité et une sécurité accrues. »

Et pour enfoncer le clou, il s’empresse de souligner que 73% des serveurs équipés de GPU, conçus pour alimenter les applications d’IA, utilisent des puces Xeon nécessaires à leur bon fonctionnement. Tout en omettant bien évidemment de préciser qu’en réalité sur la quasi-intégralité de ces serveurs, ce sont en réalité des GPU qui entraînent et animent les IA.

Un Xeon 6 P très attendu

On le sait, la gamme Xeon fait intégralement peau neuve en 2024 avec une volonté affichée de la scinder en deux familles. Des Xeon 6 E « Sierra Forest », déjà lancés, à cœurs « Efficience » principalement pensés pour les hyperscalers afin d’offrir une flopée de cœurs virtualisables sur des machines à consommation électrique restreinte. Et les Xeon 6 P, à cœurs « Performance », pensés pour la haute performance et l’optimisation des datacenters.

La sortie des Xeon 6 P « Granite Rapids » est importante pour Intel à plus d’un titre. Ne serait-ce que parce qu’elle lui permet de détrôner AMD en termes de nombre de cœurs « P » embarqués, alors que son concurrent tenait le podium depuis 5 ans. Le Xeon 6900P, fleuron de la gamme, embarque ainsi 128 cœurs « Performance », 12 canaux mémoire, mais aussi toute une série d’accélérateurs pour booster l’inférence des IA, l’encodage des vidéos, etc. Ainsi, les Xeon 6 P – contrairement aux Xeon 6 E qui en sont dépourvus – bénéficient bien des technologies AVX-512 (calculs vectoriels) et AMX (calculs matriciels) d’Intel très utiles pour accélérer les calculs IA et HPC.

La gamme, au lancement, comporte 5 modèles embarquant de 72 à 128 cœurs, mais d’autres modèles pour petits serveurs et Workstations sont attendus avec des versions 16 et 48 cœurs.

Si les Xeon 6 P annoncés sont effectivement compatibles avec des machines « Dual Socket », il ne semble pas devoir y avoir de déclinaisons pour des machines 4 ou 8 sockets. La multiplicité des cœurs embarqués dans une puce rendrait elle désormais caduques les grosses à 4 socket et plus ? Probable vu les alimentations et systèmes de refroidissement démesurés qu’il faudrait mettre en place pour les faire fonctionner.

Par rapport aux Xeon 5, ces Xeon 6P se montrent 2 fois plus véloces en général (notamment sur l’exécution des bases de données) mais aussi 2,5x plus rapides pour les calculs HPC et 3 fois plus rapides dans l’inférence des modèles IA. De quoi permettre enfin à Intel de reprendre le leadership de la performance à AMD.

Gaudi 3 veut chatouiller NVidia

AMD et Intel ne rêvent plus que d’une chose : concurrencer NVidia sur le terrain des accélérateurs IA. Plus facile à dire qu’à faire. D’abord parce que les acteurs de l’IA ne jurent que par les H100, H200 et nouveaux B200 de NVidia, ensuite parce que tout l’existant logiciel est optimisé pour ces GPU. Reste que NVidia a du mal à fournir la demande et que les tarifs que pratique la nouvelle star de Wall Street laissent forcément de la place à une concurrence plus agressive en la matière.

C’est exactement le terrain de jeu de Gaudi 3, le nouvel accélérateur d’IA d’Intel pour les Datacenters. Certes les performances semblent significativement en deçà d’un NVidia H100 ou AMD Instinct 300X, mais les prix pratiqués par Intel sont apparemment deux fois moindres.

Avec ses 64 cœurs Tensor, ses 8 MME (Matrix Multiplication Engine) et ses 128 Go de mémoire HMB2E, le Gaudi 3 est sans conteste bien plus performant et plus ambitieux que son prédécesseur, le Gaudi 2. Avec son support intégré des protocoles vidéo H265, H264 et VP9, il est aussi très bien armé pour toutes les applications IA d’analyse de flux vidéo.

Toutefois avec des performances de 1856 TFLOPS en FP8 (contre 3958 TFLOPS pour le H100) et l’arrivée des Blackwell chez NVidia, Intel va avoir du mal à redorer son blason dans l’univers de l’IA même en jouant la carte de l’efficience et du rapport performance/prix. Mais le Gaudi 3 pourrait lui permettre de trouver une place de prédilection dans les datacenters d’entreprise en quête d’accélération IA « on premises » à des prix raisonnables.

