Etendre les fonctionnalités des systèmes de stockage NAS à mémoire flash pour des solutions de cloud hybride telle est la mission de la société Avere

« Le théorème CAP est un des éléments clés gouvernant la manière dont les entreprises peuvent organiser, gérer et stocker leurs données » expliquait Ron Bianchini, CEO de Avere lors de l’IT Press Tour à Palo Alto, « mais il est très important pour nous parce que nous en apportons une des meilleures réponses ». Enoncé en 2000 par Eric Brewer, Professeur à l’Université de Berkeley et employé de Google, ce théorème indique qu’il est impossible pour un système distribué d’apporter simultanément trois caractéristiques essentielles :

– d’offrir la cohérence des données sur tous les nœuds du système ;
– de fournir des données et de répondre à une requête indépendamment de la partition du réseau
– et d’assurer la disponibilité des données si une partie du système est en panne.

Ce théorème pose donc un problème théorique de base dans le Cloud fondé sur des architectures massivement distribuées, aussi bien pour le stockage des données que l’exécution des applications ou des services. Le système distribué Spanner de Google, évolution de GFS présentée en 2009, ou le système de base de données distribuée NoSQL se sont confrontés à ce théorème en apportant des solutions plus ou moins partielles de timing, de scalabilité, de partitionning, de latence des transactions et de réplication des données. Le théorème montre qu’un système distribué peut apporter en même temps 2 des caractéristiques, mais pas 3.

Au départ, un système NAS pour gérer le flash

Accompagné d’une solide équipe d’anciens de Spinnaker et de NetApp, Ron Bianchini créait Avere à Pittsburg (PA) il y a une dizaine d’années. Il est rejoint par Mike Kazar, ancien de Carnegie Mellon et membre du projet Andrew File System (AFS), qui s’inscrivait dans le mouvement des architectures et systèmes distribués. AFS était précurseur des technologies « object based storage » aujourd’hui largement utilisées dans le Cloud et a aussi fortement influencé Coda file system et la version 4 de NFS de Sun Microsystems.

« Nous avons créé la société en 2008, avec une équipe de spécialistes du stockage des données, poursuit Ron Bienchini. A l’époque, le Cloud était balbutiant, précise-t-il, et à ce moment là, nous étions centrés sur l’arrivée des mémoires flash dans les data centers et sur la manière d’étendre l’expérience du NAS (Network Attached Storage) aux stockages sur flash dans les data centers. Ceci constitue l’ADN de la compagnie aujourd’hui parce que tout est parti de là et nous avons ensuite évolué vers le Cloud lorsqu’il a commencé à s’imposer aux entreprises. » 

Son premier produit en 2009 était une appliance NAS, le FXT Series capable de gérer dynamiquement les données entre les capacités de stockage disque dur (HDD) et électronique (Solid State). Il accélérait les performances et réduisait de moitié les coûts d’investissement en stockage et par divisait par un facteur 5 le coût de fonctionnement d’un NAS. Il mettait les données actives sur un ou plusieurs FXT en cluster (Flash rapide) en découplant le disque dur du provisionning réalisé par le NAS, libérant ainsi de l’espace de stockage disque moins cher.

L’AOS (Avere Operating System) qui supporte aujourd’hui un grand nombre d’OS, systèmes de stockage et protocoles de réseaux (NFS, SMB, CIFS…), est un véritable OS qui comporte des algorithmes d’allocation qui détectent les fréquences d’accès et les types de charges. Ils gèrent automatiquement le placement des données sur plusieurs niveaux internes pour améliorer les performances et distribuent ensuite la charge dans le cluster FXT en minimisant les demandes au serveur de stockage de masse. Les échanges de données sont gérés par le système et se font au niveau du fichier ou même du block en temps réel, sans qu’il soit besoin de mettre en place des tableaux de règles complexes et de les mettre à jour régulièrement.

Intégration des NAS de l’entreprise et du cloud

« Les acteurs traditionnels dans les systèmes de stockages comme Net App, Ipsilon ont eux aussi pris en compte le flash, affirme Ron Bianchini, mais ils faisaient du « recache », c’est-à-dire que seulement 30% des applications pouvaient en profiter parce que beaucoup de données importantes comme les métadatas restaient sur le disque dur. L’avantage est qu’ils n’ont pas eu à ré-ecrire leurs systèmes de gestion de fichiers… Notre approche a été différente, plus profonde et plus sophistiquée en optimisant astucieusement et automatiquement l’utilisation du flash dans une architecture dite ‘lite back cache’. L’utilisateur peut aussi disposer d’un script s’il veut customiser certaines priorités entre la RAM, le Flash et le Disque. Ainsi nous apportons les meilleures benchmarks SPEC face à nos concurrents. Notre système est un véritable accélérateur de NAS. »   

La société a commencé de faciliter la migration des données vers le cloud, mais les clients qui utilisaient des réseaux publics WAN (Wide Area Networks) voulaient éviter à leurs utilisateurs la latence élevées qui existait entre eux et le Cloud. Ils voulaient obtenir pour le Cloud les mêmes performances qu’avec leurs propres data centers. A la fin 2013, la société annonce son premier produit FXT Edge d’accélération de stockage pour le Cloud Amazon S3. Il permet d’utiliser le Cloud avec une latence identique à celle des charges de travail qui étaient jusque là réservée aux seuls stockages de haute performance « in house ». Avere Flash Cloud Software intègre les données sur le Datacenter « in house » avec celle sur le Cloud Storage d’Amazon S3 en un seul nom d’accès (GNS).  Les applications les plus critiques peuvent accéder à 450 To de données, de la même manière où qu’elles se situent, avec une faible latence. Le clustering apporte une très haute sécurité, même en cas de chute du réseau. Les NAS accélérés de l’entreprise ne font plus qu’un avec le Cloud d’Amazon et servent de front office pour les données stockés dans le Cloud.

Emergence du Cloud Hybride avec Cloud Storage et Cloud Compute

L’année suivante, Avere annonce Snapshot, un système de sauvegarde et de récupération des données dans le Cloud. Microsoft Azure et Google s’ouvrent à Avere, mettant les utilisations Cloud hybride sur le devant de la scène pour répondre à la demande de leurs clients. Cette possibilité appelée « cloud storage » modifie considérablement l’équation économique d’une infrastructure IT qui peut disposer d’énormes quantités de stockage sur le Cloud aux mêmes conditions de performance, d’intégrité et de sécurité que si elles étaient gérées dans l’entreprise. Allant au delà du stockage sur le Cloud, Avere a aussi réalisé l’opération inverse que Ron Bianchini appelle « cloud compute ».  Elle permet de compiler les applications dans le Cloud et d’utiliser, à partir du cloud et avec du Flash installé localement dans le Cloud, les données qui sont stockées in house, avec les mêmes conditions de performance… Les plateformes de cloud peuvent ainsi envisager de devenir des plateformes de service avec les données propres à l’entreprise…

Ainsi, la société apportait une meilleure solution au théorème CAP en combinant très profondément le Cloud avec les systèmes in house et se plaçant à la frontière (edge) entre l’entreprise et le Cloud où il combine les avantages du NAS avec les technologies d’Object Based Storage, distribuées dans le Cloud.  « Avere en tant que NAS a la cohérence des données et la conformité parce qu’il est conforme à POSIX affirme Ron Bianchini. Le cloud public et l’Object Based storage offrent une haute disponibilité, mais éventuellement la cohérence est alors un peu moins forte que la cohérence offerte par le NAS. Nous sommes très bien positionnés dans le « edge computing ». L’AOS en est aujourd’hui à sa version 6 et continue d’être amélioré.

Une activité florissante et prometteuse

Les clients de Avere affluent, parmi les plus grandes entreprises américaines utilisateurs de données. Le système Avere a été utilisé pour la fabrication de pratiquement la quasi totalité des films à grand succès de l’année 2013, 2014, 2015 et dans 30 des 33 films au hit parade de 2016 (les 3 manquants sont chinois). « Nous avons commencé dans le M&E (Multimedia and Entertainement) avant même l’arrivée du Cloud indique Ron Bianchini parce qu’ils faisaient travailler des artistes à différents endroits, reliés par un WAN ». Avere travaille aussi avec les plus grandes sociétés de IT, dont Google, Amazon, Microsoft, les sociétés dans les sciences de la vie, les grandes sociétés financières, les agences gouvernementales…

Aujourd’hui, la société a levé plus de 90 millions de dollars depuis sa création et son dernier tour de table de 14 millions de dollars, qui date du mois de mars dernier, lui permettait de faire entrer Google au Capital. « Il s’agit de Google Inc et non pas de Google Venture, ce qui est assez rare précise Ron Bianchini. » Il ajoute que depuis que la société a commencé son évolution vers le Cloud et qu’elle a ouvert FXT à Google en 2014, le nombre de clients entreprise de Google aurait considérablement augmenté. Le produit OEM de Avere vendu par Google est assez simple d’accès pour des utilisateurs avec peu d’expérience sur le Cloud et permet à Google de les engager plus facilement dans une transition vers le Cloud grâce à ses caractéristiques et ses performances. Google décernait ainsi à Avere le titre de « Technolgy Partner de l’année 2016 ». Le chiffre d’affaire de la société a plus que doublée depuis l’année dernière et la société devrait être rapidement profitable alors que le Cloud hybride monte en puissance. La société d’analyse de marché Markets and Markets estime en effet que le cloud hybride dans le monde passera de 33,28 milliards de dollars en 2016 à 91,7 milliards de dollars en 2021, soit une croissance annuelle de 22,5%. A la fin de sa présentation, Ron Bianchini indiquait qu’il fallait s’attendre dans les prochains mois à une intégration plus poussée entre Avere et Google.