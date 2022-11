À l’occasion de son grand évènement cloud annuel, Re:Invent, AWS annonce une nouvelle déclinaison de son processeur maison Graviton spécialement conçu pour les calculs intensifs et les workloads HPC. Il annonce parallèlement adopter lui aussi les nouveaux Intel Xeon Sapphire Rapids…

L’an dernier, à l’occasion de Re:Invent 2021, Amazon annonçait la finalisation de la troisième génération de son processeur maison, le Graviton 3. Le processeur était surtout destiné à animer des instances serveurs offrant un excellent rapport performance/prix/consommation électrique pour des sites et applications Web.

Cette année, AWS annonce une nouvelle variante de ce processeur – le Graviton 3E – spécialement optimisée pour le monde du HPC et des calculs intensifs. Cependant, l’hyperscaler est resté très vague sur les caractéristiques techniques de cette évolution. On sait que le Graviton 3 améliorait déjà par 2 ses calculs en virgule flottante par rapport à l’itération précédente. Selon AWS, le « 3E » serait 35% plus rapide sur ce type de calcul que la version « 3 » classique.

Ce nouveau processeur trouve son implémentation dans les datacenters d’AWS au travers de nouvelles instances « HPC7G » qui outre leur processeur Graviton 3E bénéficie d’autres améliorations annoncées par AWS à commencer par la cinquième génération de son hyperviseur maison Nitro qui anime le cloud de l’hyperscaler.

Les instances HPC7G proposent jusqu’à 64 vCPU et 128 Go de RAM et sont calibrées pour les workloads HPC.

Il faut aussi noter que ces nouvelles instances bénéficient d’autres améliorations au niveau de la Stack réseau d’AWS. Les Workloads HPC comme les Workloads IA ont besoin de manipuler des volumétries de données de plus en plus impressionnantes. Pour absorber ces volumétries croissantes, AWS a réécrit sa pile EFA (Elastic Fabric Adapter) en implémentant une alternative à TCP dénommée SRD (Scalable Reliable Datagram) qui tire profit du routage multivoie (multipath routing). Avec en conséquence des temps de latence réduits à minima de 30% et une bande passante en hausse de 60%.

Des performances qui sont aussi intimement liées aux cartes Nitro 5 qui équipent les serveurs et qui justement se voient confier la gestion du SRD et du trafic réseau.

Dit autrement, Nitro 5 et SRD sont en passe de profondément booster et fiabiliser les couches du réseau interne qui sert de fondation au cloud AWS.