Moins de trois ans après l’introduction du z15, IBM renouvelle déjà sa gamme de mainframes avec des z16 ouvertement positionnés sur les workloads d’Intelligence Artificielle.

En cette journée du 5 avril 2022, IBM annonce son nouveau mainframe… À l’heure du cloud, des clusters kubernetes, des HPC exascale, des développements quantiques, l’information sonne un peu comme un anachronisme. Et pourtant…

Les mainframes IBM restent utilisés par deux tiers des entreprises du Fortune 100, par 45 des 50 plus grandes banques, par 8 des 10 plus grandes compagnies d’assurance et par 8 des 10 plus grands Telcos. Ainsi, selon IBM, ses zSystems traitent 70% des transactions mondiales (un chiffre à relativiser puisqu’il s’agit d’un pourcentage en valeur et non en nombre de transactions).

« IBM Z est la référence en matière de traitement des transactions hautement sécurisées » affirme Ric Lewis, SVP, IBM Systems.

Sécurisé pour l’ère quantique

Bien sûr, IBM continue de considérer sa plateforme mainframe comme la plateforme informatique la plus sûre du marché. Et avec le z16, elle innove encore dans le domaine. « Le z16 est protégé par une technologie ‘quantum safe’ (résistante à l’ère quantique) à travers les multiples couches du firmware pendant le processus de démarrage. C’est le premier système à prendre en charge un démarrage sécurisé (secure boot) à sécurité quantique » explique le constructeur.

On le sait, avec le fameux algorithme de Shore, les ordinateurs quantiques seront probablement un jour en capacité de craquer la plupart des données chiffrées actuelles. C’est pourquoi IBM et des startups s’intéressent, dès aujourd’hui, à des techniques de chiffrement et de sécurisation qui puissent résister à l’arrivée des machines quantiques. Le z16 est ainsi compatible avec l’adaptateur Crypto Express8S qui procure des API « quantum safe » permettant aux entreprises de développer des chiffrements résistants aux calculs quantiques. IBM rappelle qu’il n’est pas trop tôt pour s’atteler à une telle problématique et soupçonne certains gouvernements et gangs de hackers de déjà commencer à accumuler des données chiffrées pour les analyser lorsque les machines quantiques le permettront.

Inscrire le mainframe dans les processus modernes

Et bien sûr, IBM continue de moderniser l’image des mainframes expliquant que ses mastodontes peuvent aujourd’hui s’inscrire dans un paysage DevSecOps moderne, dans les chaînes de livraison continue et dans un monde cloud hybride. « Aujourd’hui, nous facilitons l’accès aux données sur le mainframe. Avec l’arrivée d’OpenShift sur la plateforme, nous exécutons désormais des charges de travail containeurisées et des microservices sur nos mainframes » explique ainsi Ross Mauri, general manager de la division IBM Z. « Nous embrassons les technologies open-source sur la plateforme IBM z et offrons une expérience de développement commune à travers le cloud hybride. Le z16 avec sa capacité et sa puissance accrues permettra de mieux gérer les charges de travail modernes. »

IBM avait préparé le terrain il y a quelques semaines en lançant sa « Cloud Modernization Stack » (une plateforme de conversion de codes Cobol et PL/I en Java associée aux supports de technologies open source comme Ansible, Python, Node.js, GoLang ainsi qu’une sandbox zOS sur OpenShift) et son « Cloud Modernization Center » (un portail regroupant des services et partenaires de modernisation des workloads zOS).

De l’IA à dose maximale

Pour autant la vraie nouveauté est ailleurs. Avec le Z16, IBM ajoute une nouvelle corde à son instrument mainframe : l’intelligence artificielle. « Qu’il s’agisse de réduire les coûts, de diminuer les risques de fraude ou d’augmenter les revenus, l’IA du système z16 va ouvrir de nouvelles possibilités qui n’étaient pas envisageables auparavant » assure Ross Mauri.
S’appuyant sur les capacités d’accélération des inférences de son nouveau processeur Telum, l’IBM z16 peut analyser 300 milliards de requêtes d’inférence par jour avec une latence d’une milliseconde. La première application mise en avant par IBM est la détection de fraudes sur les transactions de cartes bancaires qui pourra se faire en quasi-temps réel.
Selon IBM, le z16 offre des temps de réponse accélérés par 20 et une bande passante 19 fois supérieure sur les inférences que des serveurs x86 similaires.

Le processeur Telum embarque en effet un accélérateur d’inférence de 6 TFLOPS indépendant des cœurs de calcul. On notera au passage qu’IBM s’est bien focalisé sur l’exécution des inférences et non sur l’accélération des phases d’apprentissage. L’IBM z est une machine à dévorer des transactions pour faire tourner les Business, pas une machine d’exploration et de recherche.

Un processeur qui fait toute la différence

Le Telum, la puce de l'IBM mainframe z16L’IBM z15 (comme le z14) était équipé de multiples processeurs différents reliés par un contrôleur système. Typiquement, le CPU du z15 comportait deux paires de processeurs de calcul de 12 cœurs orchestrés par un contrôleur système embarquant 960 Mo de cache L4 partagés entre les 4 processeurs de calcul. Chaque tiroir du z15 embarquait 5 puces (donc 20 processeurs de calcul et 5 contrôleurs), un z15 « type » comportant 4 tiroirs.

L’IBM z16 adopte une architecture différente. Son CPU regroupe sur un même package (une même puce) deux processeurs IBM Telum (dévoilé en août dernier), fabriqués en technologie 7 nm par Samsung, chacun doté de 8 cœurs de calculs (16 cœurs par socket donc). On notera au passage qu’IBM a opté pour l’association de 2 CPU sur un « package », une solution aussi choisie par Apple pour son M1 Ultra et par NVidia pour son « Grace Superchip ».
Chacun des 4 tiroirs du z16 embarque 4 puces. Autrement dit, au total, un z16 comporte donc 32 CPU et donc 256 cœurs de calcul fonctionnant chacun à 5,2 GHz !

Nous ne rentrerons pas dans le détail, mais l’architecture du Telum avec ses caches partagés et ses cœurs reliés par un double bus ultra rapide engendre des performances en nette hausse. IBM parle de 40% de performance en plus par socket comparé au z15.

Pour donner une petite idée de ce qu’un « mainframe » comme un z16 peut réaliser, on retiendra qu’une machine z16 complète (avec ses 4 tiroirs remplis) peut, en théorie, gérer simultanément 3,5 millions de containers Docker. Il faudrait 275 serveurs x86 (à processeurs Xeon 18 cœurs) pour animer autant de containers. NB : Les containers évoqués ici sont minimalistes et embarquent un serveur NGINX pour animer un microservice.

Reste à savoir si toutes ces innovations, tous ces efforts de modernisation des machines « IBM z » suffiront à prolonger encore longtemps l’usage des mainframes. Depuis l’annonce de Fujitsu de mettre définitivement fin à ses offres mainframes (et à leur support) d’ici 2031, IBM demeure seul en piste sur ce marché. Et il est très difficile de savoir exactement combien sa division mainframe lui rapporte. Ses ventes étaient en baisse de 6% sur le dernier exercice trahissant une certaine fin de cycle de la génération z15. Mais on manque d’informations précises. Ses résultats sont aujourd’hui fondus dans ceux de la division « Hybrid Cloud » d’IBM qui a réalisé 2,9 milliards de CA au quatrième trimestre 2021. IBM évite de rentrer dans les détails. L’activité mainframe reste cependant considérée, par bien des analystes, comme une vache à lait (cash cow) pour le groupe.

Pour terminer, signalons que le z16 sera officiellement disponible en mai 2022.