À l’occasion de son grand évènement cloud annuel, Re:Invent, AWS annonce une nouvelle déclinaison de son processeur maison Graviton spécialement conçu pour les calculs intensifs et les workloads HPC. Il annonce parallèlement adopter lui aussi les nouveaux Intel Xeon Sapphire Rapids…

L’an dernier, à l’occasion de Re:Invent 2021, Amazon annonçait la finalisation de la troisième génération de son processeur maison, le Graviton 3. Le processeur était surtout destiné à animer des instances serveurs offrant un excellent rapport performance/prix/consommation électrique pour des sites et applications Web.

Cette année, AWS annonce une nouvelle variante de ce processeur – le Graviton 3E – spécialement optimisée pour le monde du HPC et des calculs intensifs. Cependant, l’hyperscaler est resté très vague sur les caractéristiques techniques de cette évolution. On sait que le Graviton 3 améliorait déjà par 2 ses calculs en virgule flottante par rapport à l’itération précédente. Selon AWS, le « 3E » serait 35% plus rapide sur ce type de calcul que la version « 3 » classique.

Ce nouveau processeur trouve son implémentation dans les datacenters d’AWS au travers de nouvelles instances « HPC7G » qui outre leur processeur Graviton 3E bénéficie d’autres améliorations annoncées par AWS à commencer par la cinquième génération de son hyperviseur maison Nitro qui anime le cloud de l’hyperscaler.

Les instances HPC7G proposent jusqu’à 64 vCPU et 128 Go de RAM et sont calibrées pour les workloads HPC.

Il faut aussi noter que ces nouvelles instances bénéficient d’autres améliorations au niveau de la Stack réseau d’AWS. Les Workloads HPC comme les Workloads IA ont besoin de manipuler des volumétries de données de plus en plus impressionnantes.  Pour absorber ces volumétries croissantes, AWS a réécrit sa pile EFA (Elastic Fabric Adapter) en implémentant une alternative à TCP dénommée SRD (Scalable Reliable Datagram) qui tire profit du routage multivoie (multipath routing). Avec en conséquence des temps de latence réduits à minima de 30% et une bande passante en hausse de 60%.
Des performances qui sont aussi intimement liées aux cartes Nitro 5 qui équipent les serveurs et qui justement se voient confier la gestion du SRD et du trafic réseau.
Dit autrement, Nitro 5 et SRD sont en passe de profondément booster et fiabiliser les couches du réseau interne qui sert de fondation au cloud AWS.

AWS adopte aussi les Sapphire Rapids

Les Xeon Scalable de 4 ème génération, nom de code « Sapphire Rapids », sont un peu une arlésienne. Depuis un an, Intel en annonce la sortie imminente puis la repousse. Apparemment, ils sont enfin là mais les premiers à pouvoir en profiter ne sont autres que les hyperscalers. Ces dernières semaines on les a vus apparaître sur Google Cloud, sur le propre cloud d’Intel et désormais sur le cloud AWS.

Le cloud d’Amazon annonce en effet de nouvelles instances « R7iz » pour les applications intensives et l’IA. Ces instances peuvent être configurées pour proposer jusqu’à 128 vCPUs et jusqu’à 1 To de RAM.

Profitant notamment de la fréquence maximale de 3,9 GHz avec tous les cœurs actifs des nouveaux Sapphire Rapids, ces instances R7iz fournissent plus de performance par vCPU que n’importe quelle autre instance EC2 animée par un processeur Intel. Elles ont une bande passante mémoire 2,4 fois plus étendue que les autres instances EC2 comparables et une bande passante réseau de 50 Gbps et une bande passante stockage EBS (Elastic Block Store) de 40 Gbps.
Ces instances sont bien évidemment animées par les nouvelles cartes Nitro 5.