Oracle Cloud continue d’étoffer son offre et présente une roadmap à court terme pour enrichir les instances dédiées à offrir du calcul HPC dans le nuage. Instances qui feront la part belle aux GPU de Nvidia et, plus rare, aux CPU ARM.

Contrairement aux prévisions pessimistes du Forrester en début d’année, Oracle Cloud n’a pas l’intention de baisser les bras face à AWS, Azure et GCP. Bien au contraire. Le cloud Oracle multiplie les investissements et les annonces pour tenter de rattraper son retard profitant d’une infrastructure cloud plus jeune que celle de ses concurrents. Ne pas être le pionnier a aussi ses avantages.

Oracle Cloud annonce cette semaine sa volonté de monter en puissance en matière de HPC hébergé dans le cloud. L’hyperscaler américain dispose déjà d’une offre en la matière avec notamment des « HPC Compute Instances » s’appuyant sur des processeurs Intel de génération Ice Lake et du stockage NVMe et 100 Gbps RDMA. Si l’on en croit le récent benchmark IO500, Oracle Cloud prodiguerait même la meilleure bande passante des opérateurs cloud et s’affiche en tête du TOP10 des serveurs de fichiers BeeGFS (selon les mesures IO500).

Rappelons par ailleurs qu’Oracle Cloud ne joue pas uniquement la carte Intel. L’hyperscaler a récemment introduit sa première génération d’instances flexibles E3 qui permettent aux clients de concevoir leurs instances avec un nombre personnalisé de cœurs de processeur et de mémoire en fonction de leur charge de travail et des besoins de leurs applications (au lieu de se fixer des tailles fixes avec des ressources et des coûts gaspillés). Ces instances s’appuient sur la génération de processeurs AMD ROME. Oracle annonce l’arrivée de nouvelles instances E4 basées sur la prochaine génération de processeurs AMD en début d’année prochaine.

Du GPU Nvidia

Poursuivant ses efforts en matière de « Cloud HPC », Oracle Cloud annonce la disponibilité générale de nouvelles instances dopées aux GPU NVIDIA A100.
Disponibles dans plusieurs régions US, EMEA et JAPAC, ces instances débutent à 3,05$ par GPU et par heure, un tarif attractif.
Ces instances « bare-metal » peuvent aisément être mises en cluster via l’interface Oracle Cloud afin d’obtenir un HPC virtuel et hébergé équipé de 512 GPU, de quoi monter une infrastructure d’entraînement des IA plutôt conséquente. D’autant que chaque nœud offre jusqu’à 1,6 Tb/s de bande passante, embarque jusqu’à 8 GPU A100 interconnectés avec NVLINK, jusqu’à 2 To de RAM (et 320 Go de VRAM) et jusqu’à 25 To de stockage SSD NVMe. Côté performance, c’est du lourd.

De l’ARM signé Ampère

Quand on parle de HPC, un nom revient de plus en plus souvent : ARM. Rappelons que ces processeurs équipent notamment le plus puissant supercalculateur actuel et le premier de l’ère exascale : le Fugaku japonais du RIKEN Center for Computational Science.

Mais ARM continue d’avoir des relations chaotiques avec les fournisseurs cloud.
Le français Scaleway a longtemps proposé des instances ARM64 avant de décider de les retirer de son catalogue en 2020.
Azure a d’abord travaillé avec Qualcomm sans jamais rien finalisé. Depuis la fin 2019, Azure dispose d’instances ARM s’appuyant sur les processeurs ThunderX2 de Marvell (qui a acquis Cavium) mais celles-ci semblent pour l’instant uniquement réservées à des projets internes ou spécifiques.
Finalement l’acteur cloud le plus investi n’est autre qu’AWS. Amazon a même développé son propre processeur ARM, dont la dernière version se prénomme Graviton2. S’appuyant sur l’architecture de cœurs Neoverse N1 (Zeus) imaginée par ARM pour le cloud et le HPC, Graviton2 est un processeur 64 bits à 64 cœurs N1.

Oracle Cloud voit dans ARM une opportunité de se démarquer, notamment pour animer des instances HPC dans le cloud. Une vision qui, soit dit en passant, s’aligne avec celle de Nvidia qui vient d’annoncer sa volonté de racheter ARM pour 44 millions de dollars.

Oracle Cloud a choisi de s’associer à Ampere pour construire ces nouvelles instances. Elles fourniront aux développeurs le meilleur rapport qualité-prix par coeur, comparées à toute autre instance de calcul x86, promet Oracle. Dès le début de l’année 2020, de nouvelles instances « bare-metal » et virtuelles (VM) seront proposées offrant jusqu’à 160 cœurs (à une fréquence de 3,3 GHz). Elles seront animées par des distros Linux à commencer par Ubuntu et bien évidemment Oracle Linux. Elles seront aussi disponibles au travers de l’offre « Always Free Tier » offrant des services gratuits pour les tests et phases de développement.

Un partenariat avec Rescale

Rescale a débuté avec cette idée de développer un simulateur de HPC. Très rapidement la plateforme a trouvé sa place dans le cloud afin de permettre d’assembler aisément des instances hébergées pour former et déployer un HPC dans le nuage en quelques minutes.
Depuis sa plateforme, dénommée ScaleX, s’est imposée comme l’une des solutions de gestion et de déploiement HPC les plus universelles du marché. Rescale est d’ailleurs disponible sur AWS, Azure, GCP et IBM depuis plusieurs mois voire années.
Toute la plateforme Rescale est désormais également accessible sur Oracle Cloud Infrastructure.

Avec ces annonces, Oracle affiche ouvertement ses ambitions et gonfle fortement son offre IaaS. Avec ses victoires médiatiques autour de l’hébergement de Zoom et de TikTok, le fournisseur fait aujourd’hui le forcing pour être rapidement reconnu comme la quatrième alternative derrière AWS, Azure et GCP auprès des entreprises américaines et européennes. Le chemin est clairement tracé mais la route est encore longue…