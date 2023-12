L’année Tech 2024 démarrera, comme attendu, par l’édition du fameux CES de Las Vegas où les constructeurs PC devraient dévoiler une toute nouvelle génération de PC dopés à l’IA et animés par de nouveaux processeurs qu’Intel et AMD ont officiellement lancés la semaine dernière.

Processeurs pour PC nomades, processeurs pour serveurs, accélérateurs IA pour datacenters… L’innovation s’accélère en cette fin d’année 2023 chez les créateurs de puces informatiques avec en ligne de mire l’intégration d’une IA générative plus économe et embarquée…

Core Ultra : Intel lance l’ère des AI PC

Intel a donc lancé la semaine dernière ses nouveaux processeurs mobiles de génération « Meteor Lake » annoncés comme inaugurant la plus importante refonte architecturale depuis 40 ans. Mais oublions le marketing pour en revenir aux vraies innovations. Cette nouvelle génération, la 14 ème génération des Intel Core, se démarque sur plusieurs points :

– Elle ne sera déclinée qu’en version mobile, pas de version Desktop annoncée (mais il y a fort à parier qu’on retrouvera ces processeurs très vite dans les PC ‘All_in_one’).

– Elle est la première à utiliser la finesse de gravure Intel 4 (qui revient à du 7nm).

– Elle est la première chez Intel à utiliser une conception en Chiplets, assemblés en 3D de surcroit (technologie Foveros3D).

– Elle intègre un iGPU « de gaming » dérivant des « discrete GPU » ARC d’Intel.

– Elle inaugure un nouveau nommage : adieu le « i » des Intel Core, la gamme se fivise en « Intel Core » et « Intel Core Ultra ».

– Elle intègre un vrai NPU accélérateur d’inférence dans les déclinaisons « Ultra ».

Ce qu’il faut réellement retenir ici, c’est que la nouvelle génération sera surtout intéressante dans sa déclinaison « Ultra » grâce à un NPU qui pourrait bien être obligatoire sur Windows 12 mais qui surtout ouvre une nouvelle ère de « AI PCs » qui s’annoncent comme les grandes stars du prochain CES de Las Vegas.

Autre information clé, pour la première fois les processeurs Intel mobiles rivalisent avec ceux d’AMD sur le gaming, les jeux vidéos. Tout au moins dans la série H qui promet de pouvoir jouer sur des machines ultras nomades aux derniers jeux en 1080p avec une fluidité parfaite. On notera par ailleurs que ces Intel Core Ultra supportent en standard la technologie ESS (ExtraSS) concurrente du DLSS3 de Nvidia et du FSR3 d’AMD : l’idée est de générer les images dans une résolution inférieure pour maximiser le frame-rate (et donc la fluidité), puis d’utiliser une accélération IA pour interpoler les images en 1080p et obtenir un rendu graphique bluffant.

L’intégration d’un NPU doit permettre à nos PC de faire de l’IA générative sans passer par le Cloud et avec une consommation énergétique minimale. Cela change la donne et promet des PC avec de nouvelles capacités que le prochain Windows devrait très largement exploiter. Ainsi se dessine l’avenir du PC. Intel n’a d’ailleurs pour l’instant réellement lancé que les « Intel Core Ultra » et pas encore les « Intel Core » dénués de NPU. La gamme se divise en deux : les modèles « H » destinés à la performance et les modèles « U » destinés aux économies d’énergie. Ces processeurs adoptent une architecture hybride (comme dans les générations précédentes) mais combinent désormais 3 types de cœurs différents : des cœurs « P » (Performance), des cœurs « E » (Efficience énergétique) et des cœurs LP-E (Low Power E Core).

Intel Core Ultr a H-series (28 Watts)

* Core Ultra 7 165H – 5.0GHz / 16 cœurs (6 P-cores, 8 E-cores, 2 LP E-cores) / 22 threads – GPU ARC 8 cœurs Xe – NPU 2x

* Core Ultra 7 155H – 4.8GHz / 16 cœurs (6 P-cores, 8 E-cores, 2 LP E-cores) / 22 threads – GPU ARC 8 cœurs Xe – NPU 2x

* Core Ultra 5 135H – 4.6GHz / 14 cœurs (4 P-cores, 8 E-cores, 2 LP E-cores) / 18 threads – GPU ARC 7 cœurs Xe – NPU 2x

* Core Ultra 5 125H – 4.5GHz / 14 cœurs (4 P-cores, 8 E-cores, 2 LP E-cores) / 18 threads – GPU ARC 7 cœurs Xe – NPU 2x

Intel Core Ultra U-series (15 Watts)

* Core Ultra 7 165U – 4.9GHz / 12 cœurs (2 P-cores, 8 E-cores, 2 LP E-cores) / 14 threads – GPU ARC 4 cœurs Xe – NPU 2x

* Core Ultra 7 155U – 4.8GHz / 12 cœurs (2 P-cores, 8 E-cores, 2 LP E-cores) / 14 threads – GPU ARC 4 cœurs Xe – NPU 2x

* Core Ultra 5 135U – 4.4GHz / 12 cœurs (2 P-cores, 8 E-cores, 2 LP E-cores) / 14 threads – GPU ARC 4 cœurs Xe – NPU 2x

* Core Ultra 5 135U – 4.3GHz / 12 cœurs (2 P-cores, 8 E-cores, 2 LP E-cores) / 14 threads – GPU ARC 4 cœurs Xe – NPU 2x

Intel annonce également pour 2024 un Core Ultra 9 185H à 5.1GHz avec 16 cœurs CPU (6 P-cores, 8 E-cores, 2 LP E-cores) pour 22 threads, un GPU 8 cœurs Xe et un NPU.

Intel Xeon Scalable 5ème génération

La génération 4 des Intel Xeon, les fameux Sapphire Rapids, n’aura pas eu une bien longue vie. Moins d’un an après sa sortie, voici qu’Intel lance déjà une cinquième génération centrée sur deux concepts : l’IA et les économies d’énergie.

Depuis des années, AMD affiche avec ses processeurs EPYC pour datacenters une suprématie sur Intel et ses Xeon en matière de consommation énergétique. Et cette cinquième génération veut tenter de minimiser l’écart dans ce domaine. Intel annonce un gain de 36% en matière de performance par Watt. Cette 5ème génération dénommée « Emeral Rapids » dispose d’un « Optimized Power Mode » qu’il faut activer dans le BIOS et qui ne l’est pas défaut. Différents Benchmarks indépendants montrent que ce mode permet de substantielles économies d’énergie (28% d’énergie économisée) pour un impact sur les performances de l’ordre de 1% dans la plupart des tests (7% au grand maximum mais pour un gain d’énergie supérieur au 28%).

On peut se demander dès lors pourquoi ce mode n’est pas actif par défaut (Intel s’attend peut-être à des incompatibilités ou des surprises et préfère jouer la prudence).

Gravés en « Intel 7 », comme la génération précédente, les Xeon Gen 5 promettent de « l’accélération IA dans chaque cœur ». Selon Intel, le processeur a été conçu pour l’ère de l’IA et permet de bénéficier d’accélérations notables sans avoir recourt à des GPU externes. Ainsi, Intel annonce des gains de performance en inférence de 42% par rapport à la génération 4. Selon les benchmarks du constructeur, ce nouveau Xeon promet des réponses de moins de 100 millisecondes sur les LLMs de 20 milliards de paramètres.

La gamme comporte 32 modèles différents. En entrée de gamme, le Xeon 5515+ dispose de 8 cœurs à 3,2 GHz (avec Turbo Max à 4,1 GHz) et un TDP de 165W. Le haut de gamme, le Xeon 8592+ embarque 64 cœurs à 2 GHz (Turbo Max à 3,9) avec un TDP de 350W.

Ces Emerald Rapids devraient également avoir une courte vie puisqu’Intel prépare déjà non pas une mais deux générations pour l’an prochain : les « Granite Rapids » à base de cœurs « Performance » et surtout les « Sierra Forest » à base de cœurs « Efficience » qui devraient embarquer jusqu’à 288 cœurs ! De quoi relancer la course à la densification des cœurs…

Gaudi 3 : Intel sur les traces de NVidia

Le marché des GPU pour l’IA est actuellement archidominé par NVidia. Mais le fabricant est sous pression avec les hyperscalers qui fabriquent leurs propres accélérateurs (TPU5 chez Google, Maïa chez Azure, Inferentia/Trainium2 chez AWS) mais aussi AMD et Intel qui espèrent venir jouer les troubles fêtes notamment dans l’univers HPC.

Intel a également levé le voile sur Gaudi3 dont le lancement doit avoir lieu en 2023. Fruit du rachat de Gaudi, Gaudi3 est un accélérateur IA dont les performances sont annoncées comme supérieures aux GPU H100 de Nvidia. Fabriqué en 5nm par TSMC, le Gaudi3 marque une substantielle amélioration sur le Gaudi2 avec 2 fois les performances de calcul, 4 fois les performances en inférence sur 16 bits, une bande passante qui fait x1,5 et une capacité mémoire également boostée par un facteur 1,5.

Intel prépare également pour 2025 un « Falcon Shore » combinant les technologies de son accélérateur IA Gaudi3 aux capacités de ses GPU ARC.

AMD MI300X et la guéguerre des chiffres

De son côté AMD réagit aussi et veut montrer que l’IA se fera aussi avec ses processeurs. Aussi bien du côté des PC que du côté des datacenters.

Le designer de puces vient ainsi de lancer son nouveau GPU accélérateur d’IA, l’Instinct MI300X à grand coup de benchmarks pour démontrer la suprématie de son nouveau chip sur le très populaire H100 de NVidia.

Composé de 153 milliards de transistors et combinant une partie en 5nm et une partie en 6nm, le MI300X s’appuie sur l’architecture CDNA 3 et comporte 19 456 cœurs GPU à 2,1 GHz, 192 Go de vRAM HBM3 et une bande passante de 5,3 To/s pour une consommation de 750 W !

Selon AMD, le MI300X est 40% plus rapide que le H100 de NVidia sur l’inférence du modèle LLama2 et 60% plus véloce sur celle du modèle Bloom 176B.

Des chiffres qui ont été contestés par NVidia : AMD a utilisé pour ces benchmarks des codes open source qui n’utilisent pas les bibliothèques optimisées de NVidia. Selon NVidia, le H100 demeure 2 fois plus performant que le MI300X en utilisant ses bibliothèques optimisées.

AMD met aussi de l’IA dans les PC

Dans le même temps, et juste avant le CES, AMD lance sa nouvelle série de processeurs « Ryzen 8040 » embarquant un iGPU « XDNA ». Chez AMD « XDNA » signifie avec accélération IA intégrée (contrairement au RDNA de ces GPU classiques) !

Avec Intel qui intègre un NPU à ses « Meteor Lake » Core Ultra, Qualcomm qui booste l’IA avec ses Snapdragon Elite et Apple qui intègre un NPU à ses M3, AMD devait rapidement réagir et s’inscrire dans cette tendance.

AMD lance donc les Ryzen 8040 « Hawk Point » délivrant 16 TOPS (Trillion operations per second) en inférence IA avec leur NPU. On y retrouve des cœurs Zen 4 et des GPU Radeon 760M ou 780M.

La gamme comporte 7 processeurs :

* Ryzen 9 8945HS : 8 cœurs à 5,2 GHz, 16 Threads, NPU intégré, GPU Radeon 780M, TDP entre 35 et 54 W

* Ryzen 7 8845HS : 8 cœurs à 5,1 GHz, 16 Threads, NPU intégré, GPU Radeon 780M, TDP entre 35 et 54 W

* Ryzen 7 8840HS : 8 cœurs à 5,1 GHz, 16 Threads, NPU intégré, GPU Radeon 780M, TDP entre 20 et 30 W

* Ryzen 7 8840U : 8 cœurs à 5,1 GHz, 16 Threads, NPU intégré, GPU Radeon 780M, TDP entre 15 et 30 W

* Ryzen 5 8645HS : 6 cœurs à 5 GHz, 12 Threads, NPU intégré, GPU Radeon 760M, TDP entre 35 et 54 W

* Ryzen 5 8640HS : 6 cœurs à 4,9 GHz, 12 Threads, NPU intégré, GPU Radeon 760M, TDP entre 20 et 30 W

* Ryzen 5 8640U : 6 cœurs à 4,9 GHz, 12 Threads, NPU intégré, GPU Radeon 780M, TDP entre 15 et 30 W

À noter que la gamme offre aussi deux autres processeurs, le Ryzen 5 8540U et Ryzen 8440U qui sont, eux, dépourvus de NPU. On ne peut que regretter le manque de transparence et de logique dans le nommage des processeurs AMD qui semble conçu pour engendrer un maximum de confusion dans l’esprit des utilisateurs. De même, on regrettera cette volonté de priver les PC d’entrée de gamme de NPU. Ce qui laisse un bel espace aux PC sous ARM, pour peu que Windows on ARM finisse par s’imposer.

Enfin, ces processeurs devraient aussi avoir une courte durée de vie puisque AMD prépare pour l’an prochain ses « Strix Point » à architecture XDNA 2 et dont la partie NPU est annoncée trois fois plus performante que sur les « Hawk Point ».

Reste désormais à attendre les grandes annonces du CES et découvrir la nouvelle génération de « AI PC » embarquant ces nouvelles puces et découvrir ce qu’elles apportent réellement au quotidien…

