Oubliez le mainframe poussiéreux : IBM dégaine un z17 survitaminé, avec des puces Telum II, de l’IA embarquée, des accélérateurs Spyre et des cartes PCIe à gogo prêtes pour la guerre des données.
Décidément, les cycles de renouvellement des mainframes IBM sont de plus en plus courts. Il est loin le temps où IBM faisait évoluer ses mainframes tous les 5 à 10 ans. Pour rappel, le z15 a été lancé en 2019, et le z16 en 2022. Trois ans plus tard, IBM lance donc son successeur, le z17. Avec en leitmotiv, « le premier mainframe conçu pour l’ère de l’IA »… Cela vous rappelle quelque chose ? Logique, IBM avait déjà largement mis en avant les enjeux de l’IA au lancement du z16, premier mainframe embarquant un accélérateur IA. Mais à l’époque, celle du lancement du M1 Ultra chez Apple et du « Grace SuperChip » chez NVidia, on parlait bien davantage de Machine Learning… C’était avant ChatGPT et l’explosion de l’IA générative.
Depuis tout a changé, bien sûr. Et les gigantesques clusters de GPU nécessaires à l’entraînement et aux inférences de l’IA ont largement démontré nos besoins de mémoire, de bande passante d’entrées/sorties et de parallélisation, exigés par les modèles génératifs.
Sauf que, pour tous les plus de 40 ans, lorsqu’on parle de besoins démesurés d’I/O et de mémoire, le souvenir du bon vieux « mainframe » si doué dans ces domaines refait forcément surface !
Et IBM compte bien nous le rappeler et l’apprendre aux plus jeunes. Car Cloud ou pas, méthodes agiles ou pas, containers ou pas, les mainframes sont toujours là ! Et les IBM z15 et z16 en service continuent de gérer quotidiennement plus de 70% des requêtes transactionnelles de l’univers bancaire.
Évolutions des besoins et des demandes obligent, célérité de l’innovation IT impose, il est déjà l’heure pour IBM de proposer un successeur digne de ce nom : le z17 !
Des machines pensées pour des usages modernes
Et l’on aurait bien tort de penser que les z17 sont uniquement destinés à faire tourner un lourd existant qualifié de dette technique. IBM a conçu le z17 pour les workloads modernes et les besoins bien actuels des entreprises en matière de traitement de données critiques. La machine intègre en standard des capacités avancées d’intelligence artificielle (IA), de sécurité renforcée et de gestion efficace des opérations.
Comme tous les mainframes, le z17 est taillé pour les workloads hypercritiques avec une disponibilité de 99,999999 % ce qui veut dire que la machine affiche un temps d’indisponibilité annuel de 315 millisecondes ! Et pour les données critiques, le z17 se veut la machine la plus fiable au monde, la plus sécurisée au monde et la seule à intégrer en standard un chiffrement post-quantique accéléré.
De même, son système de cache très optimisé et sa bande passante I/O font du z17 une machine à transactions et à manipuler massivement de la Data.
En outre, grâce à son processeur Telum II doté d’un accélérateur IA intégré, le z17 peut effectuer plus de 450 milliards d’opérations d’inférence par jour avec un temps de réponse d’une milliseconde (en supposant que le modèle IA comporte moins de 8 milliards de paramètres comme le modèle antifraude bancaire utilisé pour ce test). Le z17 est ainsi pensé pour permettre aux entreprises d’exécuter des modèles d’IA directement sur leurs données transactionnelles en temps réel, favorisant des cas d’utilisation tels que la détection de fraude, l’évaluation des risques de crédit et l’analyse d’images médicales.
Enfin, IBM y voit aussi une vraie solution d’entreprise pour entraîner et personnaliser en local, dans le centre de données de votre entreprise, des modèles frontières grâce à l’introduction d’un accélérateur maison dénommé Spyre.
Deux nouveaux Chips signés IBM
Au cœur du z17 se trouvent deux innovations majeures développées par IBM Research : le processeur Telum II et l’accélérateur Spyre (ce dernier ne sera en réalité disponible qu’à partir du quatrième trimestre 2025).
Le processeur Telum II s’appuie sur le succès de son prédécesseur, le Telum, qui équipait le z16 et intégrait déjà un accélérateur d’IA directement sur la puce – une première dans l’industrie. Telum II pousse cette innovation encore plus loin avec des performances améliorées. Le z17 gère ainsi près de deux fois plus de transactions temps réel avec sécurisation IA antifraude que son prédécesseur !
Gravé en 5 nm et cadencé à 5,5 GHz (contre 5,2 GHz pour le Telum I), les cœurs du Telum II se montrent environ 20% plus rapides et bénéficient de caches de 40% plus large pour booster leurs capacités IA. L’accélérateur IA intégré au Telum II est annoncé quatre fois plus performant que celui du Telum I.
Mais cette fois, IBM a décidé de ne plus se contenter de l’accélération IA embarquée dans le Telum II qui reste surtout adapté à des modèles de moins de 8 milliards de paramètres.
Pour satisfaire les besoins de modèles génératifs plus larges, IBM a développé un nouvel accélérateur IA externe nommé Spyre et spécifiquement pensé pour le z17. Disponible sous forme de carte PCIe optionnelle, cet accélérateur offre 32 cœurs spécialement conçus pour l’IA et exploitant les mêmes librairies que celles du Telum II. Lors des premiers tests, un prototype a traité plus de trois fois plus d’images par seconde et par watt d’électricité que des GPU haut de gamme, répondant ainsi aux préoccupations énergétiques liées aux charges de travail d’IA. Si l’on a bien lu les spécifications d’IBM, le z17 devrait pouvoir accueillir au total 48 cartes Spyre.
Une infrastructure très différente
Comme ses prédécesseurs, l’IBM z17 est une machine fascinante. Sa conception diffère très profondément des clusters de serveurs que l’on rencontre habituellement. La machine s’étend, dans sa configuration complète, sur 4 armoires. Elle se compose de 4 tiroirs « CPC » (contenant mémoire vive et processeurs) et 12 tiroirs d’entrée/sortie PCIe+ auxquels s’ajoutent 2 unités de refroidissement. Car la machine fait un usage intensif du refroidissement liquide notamment pour ses processeurs.
Chaque tiroir CPC embarque 8 processeurs Tellum II et jusqu’à 16 To de RAM. Dit autrement, un IBM z17 complet combine donc 32 processeurs Tellum II et 64 To de RAM. Sur le papier, comme chaque processeur Tellum II contient 8 cœurs, on arrive à un total de 256 cœurs. Mais sur un mainframe, rien n’est jamais aussi simple. Ainsi, IBM ne parle pas de cœurs mais de PU (Processing Unit), chaque PU pouvant décoder jusqu’à 6 instructions par cycle et exécuter jusqu’à 10 instructions par cycle.
IBM ne commercialise pas directement des « cœurs », mais des « PU » dont le prix et l’usage dépendent de la configuration choisie par le client. Une partie des « PU » est réservée par IBM pour la haute disponibilité (les Spare PU, des cœurs qui ne s’activent que pour pallier à la défaillance d’un cœur, la bascule étant automatique) et pour l’assistance aux fonctionnalités système (les PU SAP, System Assis Processor). L’autre partie des PU peut être divisée (autrement dit commercialisée) comme des cœurs standards, comme des IFL (cœur dédié à Linux), comme des zIIP (cœur dédié aux applications zOS), comme des ICF (pour gérer les communications au sein des grappes z/OS).
L’astuce, c’est que, en réalité, IBM « package » ses processeurs Tellum II par deux, formant ce qu’IBM appelle un DCM (Dual-Chip Module). Chaque tiroir de calcul CPC comporte en réalité 4 DCM. Et si en théorie, chaque DCM embarque 16 cœurs de calcul, dans la réalité, chaque DCM est commercialisé avec soit 9 à 11 PU actifs (utilisables par les workloads des clients) soit 10 à 15 PU actifs, selon les systèmes exécutés (zOS, Linux, virtualisation) et la configuration adoptée par le client. Pour être un peu plus clair, même si une machine z17 complète embarque 256 cœurs, elle n’en propose en réalité au maximum que 208 réellement accessibles aux applications.
Dans un même ordre d’idées, outre les 64 To de RAM achetables par les clients, tout IBM z17 embarque une mémoire HSA (Hardware System Area) réservée de 684 Go, propre à la gestion interne du mainframe.
Quant aux tiroirs « I/O », ils intègrent chacun 16 slots PCIe pour accueillir des cartes réseaux, des cartes de chiffrement post-quantique, des cartes de mémoire virtuelle, des cartes de stockage Flash et les fameuses nouvelles cartes accélératrices d’IA « Spyre ».
Une transformation de l’expérience mainframe
Mais IBM ne se contente pas de soigner le hardware de ses mainframes et multiplie les solutions pour s’assurer que son mastodonte s’intègre en douceur dans les chaînes CI/CD modernes et participe activement à la transformation numérique des entreprises.
Selon une récente enquête, 88% des dirigeants informatiques mondiaux considèrent la modernisation des applications comme une étape cruciale de leur transformation numérique, et 78% affirment que les mainframes resteront au cœur de cette évolution.
IBM répond à ces attentes en transformant l’expérience utilisateur des mainframes grâce à l’IA, offrant des gains de productivité significatifs pour les développeurs, les opérateurs et les utilisateurs professionnels. Le z17 introduit une série d’innovations logicielles qui simplifient le développement, la gestion des applications et des données, ainsi que les opérations.
Des innovations logicielles majeures
On commencera par rappeler que le z17 fonctionne aussi bien et simultanément s’il le faut sur l’environnement ancestral zOS mais aussi sous Linux avec un support des containers et même de Kubernetes. Preuve que les mainframes sont loin d’être des machines limitées à CICS et au Cobol!
Pour le développement d’applications, IBM a intégré watsonx Code Assistant for Z avec de nouvelles capacités d’IA générative et d’IA agentique, permettant aux développeurs de localiser rapidement la logique métier et de simplifier les améliorations des applications. IBM Test Accelerator for Z rationalise les tests d’applications mainframe, réduisant les coûts et améliorant la qualité.
En matière de gestion des données, de nouvelles fonctionnalités permettent d’exploiter à la fois les données structurées et non structurées pour des analyses IA plus approfondies. SQL Data Insights dans Db2 for z/OS a été amélioré avec de nouvelles API REST et des interfaces de ligne de commande, exploitant l’accélérateur d’IA intégré au processeur Telum II. IBM prévoit également de fournir des capacités avancées de base de données vectorielle pour Db2 for z/OS prochainement.
Pour optimiser la gestion opérationnelle, IBM Z Operations Unite unifie les données opérationnelles IBM Z provenant de multiples sources, rationalise les opérations avec l’IA et réduit les enquêtes sur les alertes par un facteur de 9. IBM Z IntelliMagic Vision pour z/OS a également été amélioré pour offrir des informations sur l’utilisation de l’accélérateur IBM Spyre, l’optimisation des E/S et la consommation d’énergie.
Un déploiement simplifié de l’IA
IBM AI Optimizer for Z permet aux organisations d’adopter et de faire évoluer les charges de travail d’IA générative pour le mainframe avec rapidité et simplicité. À partir du quatrième trimestre 2025, l’accélérateur Spyre permettra d’exécuter l’IA générative directement sur le z17, offrant aux clients la possibilité d’accélérer les cycles de vie des applications et de simplifier les opérations mainframe avec des niveaux élevés de sécurité.
En exécutant l’IA générative directement sur le mainframe avec l’accélérateur Spyre, IBM veut simplifier l’architecture, réduire la latence et éliminer les dépendances externes. De plus, avec l’IA agentique, la plateforme offre un traitement de bout en bout plus sécurisé, maintenant les données et les requêtes sensibles dans l’environnement sécurisé du mainframe.
Bref, les mainframes sont encore bel et bien là pour au moins une nouvelle génération. Il sera très intéressant de suivre effectivement jusqu’à quel point les entreprises clientes de tels systèmes leur confieront les nouvelles tâches IA dont elles vont indubitablement avoir besoin.