La mise à jour « v4.6-v4.7 » de VAST OS prétend faciliter l’utilisation de la plateforme Vast Data, étendre ses cas d’usages en brisant les silos et améliorer la qualité de service et la sécurisation..

La startup Vast Data a décidément une actualité chargée en ce début d’année 2023. Avec ses baies All-Flash optimisées pour le stockage massif de fichiers et objets, le jeune constructeur a rapidement su imposer sa marque dans le paysage, notamment dans l’univers des médias et de l’archivage, grands consommateurs de données non structurées.

Bien que toujours considérée comme un Challenger dans le Magic Quadrant du Gartner sur les systèmes de « stockage objet et fichier », la plateforme Vast Data s’est néanmoins vue attribuer la meilleure note (4,14 sur 5) dans un rapport du même Gartner sur les plateformes haute performance pour les usages analytiques. Preuve de l’efficience de son architecture distribuée DASE (Disaggregated Architecture, Shared Everything).

Un catalogue de données

La startup vient d’annoncer sa « plus importante mise à jour logicielle », une mise à jour « combinée » dénommée « v4.6 + v4.7 ». Si la sécurité et la scalabilité demeurent deux axes forts de développement de ces mises à jour, la principale innovation réside dans l’apparition d’un catalogue de données qui cache une volonté de plus grande universalité de ses baies.

« L’industrie informatique s’est accoutumée à l’idée que les magasins de données structurées, non structurées et semi-structurées devaient tous être distincts, lance en introduction Jeff Denworth, CMO de Vast Data « mais c’est uniquement parce qu’aucun système n’a été conçu pour réaliser une véritable synthèse des données, jusqu’à présent ».

Faisant un peu écho à l’idée de briser les silos de stockage que l’on retrouve derrière le « Global Data Environment » d’Hammerspace, la data orchestration d’Alluxio, la Data Management de Weka.io, le CloudFS de Panzura,  ou l’UniFS de Nasuni, Vast Data profite de son architecture Element Store pour désormais proposer au cœur de son système un véritable catalogue de données qui se veut très universel. Une extension entre la couche sémantique de description et celle des données, permet aux clusters Vast de cataloguer chaque fichier et chaque objet dans un format tabulaire extensible. Les utilisateurs de données peuvent enrichir et étiqueter les données en rajoutant des colonnes mais aussi et surtout interroger ces ensembles de données massifs facilement et à différentes fins.

Vast anticipe ainsi différents usages à ce catalogue.

Des usages IT par exemple, avec la possibilité pour les administrateurs de s’appuyer sur ce catalogue pour mieux gérer la capacité et la facturation du stockage par services, workloads, usages, etc. Les applications de sauvegarde et d’archivage pourront exploiter ce catalogue pour traverser l’espace de noms plus rapidement pour des sauvegardes différentielles plus rapides et intelligentes.

Des usages Data voire Data Science aussi pour remplacer des fonctions POSIX par des instructions SQL, accélérer les recherches, mener des interrogations complexes sur les données non structurées, etc.

Il sera intéressant de voir comment Vast Data compte faire évoluer les usages de ce catalogue à l’avenir car il pourrait servir de fondation à des datalakes d’un nouveau genre par exemple.

Plein d’autres améliorations

Cette mise à jour de VAST OS apporte son lot d’améliorations aux fonctionnalités existantes.

Typiquement de nouvelles classes de services permettent de provisionner et proposer des qualités de services personnalisées en fonction des utilisateurs. La granularité est telle, qu’il est par exemple possible de fixer des seuils minimaux et maximaux sur la bande passante et sur les IOPS pour chaque utilisateur !
La fonctionnalité est notamment essentielle lorsque les baies sont utilisées dans des infrastructures multitenant afin de mieux contenir les “noisy neighbors” et éviter que des tenants ultra-consommateurs ne paralysent les autres.

Dans un même esprit, VAST OS adapte aussi ses sécurités aux contraintes actuelles des opérateurs de service. Le système prend ainsi en charge une gestion des clés externes via le protocole KMIP 1.2. Cette interface API standard de Key Vault permet de connecter les systèmes EKM aux clusters Vast afin que les locataires puissent apporter et gérer leurs propres clés de chiffrement. Parmi les premiers systèmes EKM supportés on notera notamment la présence de Thales CypherTrust et IBM Key Protect. D’autres améliorations de sécurité font également leur apparition comme la prise en charge de l’accès basé sur TLS pour NFS, PseudoFS, Rocky Linux et Audit S3.

Côté « scalabilité », Vast améliore encore son architecture DASE (Disaggregated, Shared-Everything) et sa capacité à créer des snapshots avec n’importe quelle profondeur d’espace de noms et avec une granularité de 15 secondes. Désormais, les clusters Vast prennent en charge la possibilité de partager et d’étendre les snapshots à plusieurs clusters distants. Chaque site distant peut monter les snapshots d’un autre site et créer des clones de ces données pour transformer un instantané en une vue en lecture/écriture. Un atout très pratique pour dupliquer des données de production sur un cluster de développement par exemple.
Dans un même ordre d’idées, les baies Vast s’adaptent encore un peu plus aux spécificités des univers Kubernetes. Des diagrammes Helm sont désormais fournis pour faciliter la mise en œuvre du Container Storage Interface Kubernestes de Vast. Et ce dernier prend désormais en charge différentes classes de stockage pour les volumes persistants et éphémères.

Enfin, comme il est désormais de coutume, cette nouvelle version introduit également de l’IA au cœur du système. Grâce à l’utilisation du machine learning, la nouvelle version d’Uplink (l’interface en mode SaaS de pilotage multi-clusters) améliore les capacités de prédiction sur l’utilisation des données et les ressources nécessaires. Le Machine Learning aide également à comprendre comment normaliser les anomalies de tendance des données.

Bref, Vast Data ne s’endort pas sur ses lauriers et commence déjà à vouloir étendre son marché en s’inscrivant dans les nouvelles mouvances d’orchestration des données et de suppression des silos. La version « v4.6+v4.7 » est sans nul doute annonciatrice de nouveaux services à venir et veut désormais à séduire un peu plus une clientèle de fournisseurs d’infrastructures cloud…

 

À lire également :

Vast Data et Veeam restaurent plus vite

Vast Data et Dremio s’allient pour faciliter l’analyse d’océans de données

Vast Data s’allie au français Atempo pour assurer la sauvegarde et l’archivage sur sa plateforme

Sauvegarde full-flash : nouveau paradigme de la protection des données

« Analytics et ML changent le stockage : ils requièrent un accès rapide à toutes les données »