Souvent présenté comme le principal concurrent de Snowflake, Databricks annonce l’acquisition de Tabular, une entreprise spécialisée dans la gestion des données, pour une somme non divulguée mais évaluée par les analystes à plus d’un milliard de dollars.

Fondée en 2021, Tabular propose des produits de gestion de données basés sur la technologie open source Apache Iceberg, développé par les fondateurs de la startup quand ils étaient chez Netflix. Iceberg est un format de table adapté à d’énormes jeux de données analytiques conçu pour permettre à des moteurs SQL comme Spark, Trino, Flink, Presto, Hive ou Impala d’accéder simultanément aux mêmes gigantesques tables.
Les inventeurs d’Apache Iceberg avaient ensuite créé Tabular pour construire une plateforme de stockage simplifiant et sécurisant Apache Iceberg.

Les trois cofondateurs de Tabular, Ryan Blue, Daniel Weeks et Jason Reid, vont désormais rejoindre Databricks afin d’unifier les bases de clients et les communautés des deux entreprises. Ryan Blue assure que leur approche open source et leur engagement auprès des communautés ne changeront pas suite à cette acquisition.

Cependant, l’acquisition de Tabular par Databricks n’a rien d’anodin et soulève évidemment bien des interrogations. Car, sur le fond, la technologie Iceberg entre en concurrence avec la technologie « Delta Lake » de Databricks dans la guerre des formats pour les lacs de données. Ces deux technologies de « lakehouse », tout comme Hudi (le troisième larron), visent à offrir des fonctionnalités de type data warehouse à des stockages objets dans le cloud tout en garantissant de hautes performances. Si Iceberg est très populaire dans l’univers des moteurs open-source, Delta Lake (bien que s’appuyant sur la technologie open source Parquet) est surtout exploité par Databricks et par Microsoft Fabric.

Databricks et Tabular se veulent néanmoins rassurants et, par ce rachat, les acteurs s’engagent désormais à travailler vers un standard commun. L’objectif est d’améliorer l’interopérabilité entre ces technologies avant de les fusionner afin que les clients puissent tirer parti du travail des deux communautés sans se soucier du format sous-jacent. Un objectif qui n’a en réalité pas démarré avec cette acquisition. En effet, Databricks avait lancé dès l’an dernier son initiative « Delta Lake UniForm » pour offrir une meilleure interopérabilité entre les formats Delta Lake, Iceberg et Hudi.

Peu avant l’acquisition, Tabular avait levé 37 millions de dollars auprès d’investisseurs tels qu’Andreessen Horowitz, Zetta Venture Partners et Altimeter Capital. Databricks prévoit de finaliser cette acquisition au deuxième trimestre 2024, sous réserve des conditions de clôture habituelles.

 

À lire également :

Dell et Starburst s’associent pour lancer une nouvelle offre de Data Lakehouse hybride et ouvert

Databricks annonce l’acquisition d’Arcion pour 100 millions de dollars

Databricks acquiert MosaicML et enrichit un peu plus sa plateforme de datascience

Databricks simplifie la mise en production des modèles ML

Dataiku, Databricks et Alteryx dominent IBM, Google et Microsoft !