Dell poursuit ses investissements sur son étonnante plateforme Data Lakehouse et lui apporte un gros coup d’accélérateur des requêtes avec une technologie dénommée Warp Speed…

L’IA impose aux constructeurs de réinventer leur portfolio de solutions avec un focus sur les modèles génératifs et sur la data. En mars dernier, Dell surprenait l’écosystème IT en lançant sa propre plateforme hybride et ouverte de Data Lakehouse, combinant un stockage compatible S3 (Dell ObjectScale, PowerScale, ECS) et des briques open source (Delta Lake, Symcloud, Iceberg) avec le puissant moteur de requêtage de Starburst cœur vibrant de ce que Dell appelle son « Dell Data Analytics Engine ». La technologie de Starburst simplifie la réalisation de requêtes sur de vastes ensembles de données dispersées à travers différentes sources d’informations et différents clouds.

Mais dans la première version, Dell n’intégrait que le moteur de base de Starburst. Désormais, le Dell Data Analytics Engine intègre la fonctionnalité « Warp Speed » de Starburst (qui repose sur la technologie de mise en cache Apache Lucene) pour donner un coup d’accélérateurs aux requêtes. En l’occurrence, le temps d’interrogation peut être dans certaines circonstances divisé par un facteur 7 !

Une technologie d’auto-apprentissage

Warp Speed utilise l’intelligence artificielle pour analyser en continu les modèles de requêtes et identifier les données fréquemment consultées. « Warp Speed est une nouvelle fonctionnalité du Dell Data Lakehouse qui apprend de manière autonome les modèles de requêtes et identifie les données fréquemment consultées pour créer des index et des caches optimaux, tout en conservant les données peu consultées à leur emplacement, » explique Vrashank Jain, chef de produit chez Dell.

« Warp Speed tient la promesse d’accélérer les performances des requêtes tout en limitant les coûts », ajoute Marc Royer, Directeur Unstructured Data and Analytics pour Dell France. « Avec cette fonctionnalité, le même cluster peut exécuter des requêtes de Data Lake de trois à cinq fois plus rapidement, sans nécessiter de modifications côté utilisateur. »

Des gains de performance et d’efficacité

Concrètement, Warp Speed permet aux entreprises soit d’exécuter davantage de requêtes sur leurs clusters existants, soit de réduire la taille de leurs clusters jusqu’à 40% pour un même volume de requêtes.

La solution – totalement autonome et ne nécessitant donc aucune compétence spécifique en interne  – repose sur deux technologies clés :

L’indexation autonome, qui crée différents types d’index (bitmap, dictionnaire, arbre) adaptés à chaque bloc de données

Le « Smart Caching », un système propriétaire de mise en cache des blocs de données par colonnes

Ces innovations permettent notamment d’accélérer les opérations telles que les regroupements, les filtres et les recherches, tout en optimisant l’utilisation des ressources.

Une solution clé en main pour l’ère de l’IA

« À l’ère de l’IA, Warp Speed libère le potentiel de Dell Data Lakehouse, ouvrant la voie à l’innovation tout en respectant les contraintes budgétaires », souligne Marc Royer.

Warp Speed est désormais disponible pour tous les clients de Dell Data Lakehouse utilisant un stockage compatible Dell S3, sans changement de licence.

Par ailleurs, Dell profite de cette mise à jour de sa nouvelle plateforme pour introduire plusieurs améliorations à son Data Lakehouse, dont de nouveaux connecteurs (notamment un connecteur pour les bases graphes Neo4j), un chiffrement de bout en bout optionnel, et des fonctionnalités avancées de surveillance et de support.

En outre, la solution, jusqu’ici disponible sous forme d’abonnement sur 1 an ou 3 ans, s’enrichit d’une offre plus économique « sur 5 ans » pour ceux qui veulent s’engager sur le long terme.

Bref, Dell semble vraiment très engagé sur cette nouvelle offre « clés en main » et veut se positionner comme une alternative aux offres 100% cloud en adoptant une approche hybride basée sur les qualités de ses systèmes de stockage S3 et le meilleur des technologies open source.

 

À lire également :

Dell et Starburst s’associent pour lancer un Data Lakehouse ouvert

Dell World 2024 : Les 8 annonces marquantes à retenir

Databricks s’offre Tabular pour 1 milliard de dollars

Serverless, IA, Lakeflow, open source… Toutes les annonces du Databricks Summit 2024

Databricks lance LakeFlow pour simplifier l’ingestion de données

Le renouveau des plateformes de Data Science dans le Magic Quadrant 2024 du Gartner

Fivetran adopte les lacs de données