La plateforme data est devenue l’infrastructure critique pour industrialiser l’IA générative sans perdre le contrôle des données propriétaires, de la gouvernance et de la sécurité. Databricks accélère ce mouvement avec une seconde levée de fonds XL en 2025, une Série L qui semble préparer une prochaine introduction en bourse.
Depuis l’explosion de l’IA générative, les plateformes data ont changé de statut. Elles ne sont plus simplement le socle du décisionnel ou de la data science : elles deviennent le point de passage obligé pour créer des copilotes, automatiser des processus, déployer des agents et, surtout, garder la main sur la donnée qui fait la différence. L’enjeu n’est plus seulement de stocker et requêter, mais d’orchestrer un continuum “données → modèles → applications → agents”, avec de la gouvernance, de la traçabilité et des garde-fous de sécurité tout en continuant de prôner performance et réduction des coûts.
C’est précisément sur ce terrain, celui des “cloud data platforms” et du lakehouse, que Databricks vient de signer pour la deuxième fois de l’année, l’une des plus grosses levées privées de 2025. En effet, l’éditeur avait déjà levé 15 milliards en début d’année, ce qui bien évidemment relativise l’ampleur de cette seconde levée de fonds 2025 annoncée cette semaine et qui s’élève à plus de 4 milliards de dollars en Série L, sur une valorisation de 134 milliards de dollars. L’opération est co-menée par Insight Partners, Fidelity Management & Research Company et J.P. Morgan Asset Management, avec une liste impressionnante de participants, dont Andreessen Horowitz, BlackRock, Blackstone, Coatue, GIC, MGX, NEA, Ontario Teachers’, Temasek ou encore Thrive Capital.
Du “lakehouse” aux applications intelligentes
Databricks s’est construit autour d’Apache Spark et d’une idée devenue centrale : unifier la chaîne data dans une approche lakehouse, à mi-chemin entre data lake et data warehouse, en réduisant les silos entre data engineering, analytics, BI et machine learning.
À mesure que l’IA s’est invitée partout, l’éditeur a déplacé le centre de gravité de son offre : il ne s’agit désormais plus de préparer des données pour des modèles, mais de fournir une plateforme sur laquelle les équipes peuvent bâtir des applications complètes, pilotées par la donnée, animées par l’IA, avec gouvernance et sécurité “by design”.
Ce repositionnement se lit dans les trois produits désormais mis en avant comme moteurs de la prochaine phase de croissance de Databricks.
D’abord Lakebase, présenté comme une base Postgres serverless “pensée pour l’ère de l’IA”. Ce lakehouse vise à rapprocher les usages transactionnels et les besoins à faible latence du monde analytique, pour éviter d’empiler une base opérationnelle d’un côté et le lakehouse de l’autre, au prix d’intégrations complexes.
Ensuite Databricks Apps, une plateforme qui vise à accélérer la création et le déploiement d’applications data et IA directement dans l’environnement Databricks, avec une promesse de sécurité et de gouvernance cohérentes avec le reste de la solution. C’est une réponse très pragmatique à la réalité des entreprises : les prototypes GenAI se multiplient, mais l’industrialisation bute souvent sur des questions d’exécution, de contrôle d’accès, d’audit et de coûts. Ce sont ces verrous que la plateforme Databricks Apps cherche précisément à lever.
Enfin Agent Bricks, pensé pour “créer et mettre à l’échelle” des agents IA sur des données propriétaires. Databricks assume ici un virage agentique : l’IA n’est plus un moteur de génération de texte, mais un composant logiciel qui raisonne, s’outille et agit. Dès lors elle doit évoluer dans un cadre sécurisé et gouverné cohérent avec la plateforme de données afin d’orchestrer, contrôler et superviser les actions des agents IA autonomes.
Cette nouvelle levée de fonds doit d’abord permettre à Databricks d’accélérer le développement autour de ces trois fondations. Mais ce capital doit aussi servir à offrir de la liquidité aux collaborateurs, à soutenir de futures acquisitions IA et à approfondir la R&D.
Un succès fulgurant
Et la formule semble décidément séduire de plus en plus d’entreprises malgré une farouche concurrence. Une trajectoire financière qui parle aux DSI
Databricks encadre cette levée par des chiffres rarement affichés à ce niveau de détail dans le non-coté. Databricks revendique un chiffre d’affaires annualisé de 4,8 milliards de dollars au troisième trimestre 2025, en croissance de plus de 55% sur un an. Elle met en avant plus d’un milliard de dollars de revenus annualisés côté entreposage de données et plus d’un milliard côté produits d’IA, ainsi qu’un free cash flow positif sur les 12 derniers mois. Elle souligne aussi une rétention nette supérieure à 140% et plus de 700 clients au-delà d’un million de dollars de revenu annuel.
Dit autrement, Databricks se positionne comme une plateforme structurante, au moment où les entreprises cherchent à standardiser leur chaîne data/IA et à éviter la prolifération d’outils. Et la formule séduit.
« Les entreprises réinventent rapidement la manière dont elles construisent des applications intelligentes, et la convergence de l’IA générative avec de nouveaux paradigmes de codage ouvre la porte à de tous nouveaux workloads. Avec cet investissement, nous approfondissons notre engagement à aider chaque organisation à innover avec l’IA sur ses propres données », explique ainsi Ali Ghodsi, co-fondateur et PDG de Databricks. « En ancrant les données transactionnelles dans Lakebase, en offrant des expériences intuitives via Databricks Apps et en permettant des systèmes multi-agents avancés avec Agent Bricks, nous donnons aux clients une fondation unifiée pour construire des applications intelligentes de données fiables et performantes à grande échelle. »
La bataille des Data Plateformes de l’IA
Cette levée renforce une dynamique déjà visible : la bataille ne se joue plus uniquement sur le data warehouse versus le lakehouse, mais sur la plateforme qui deviendra le point d’assemblage des données, des modèles et des applications agentiques. Snowflake reste l’adversaire le plus direct sur l’espace “data platform” en entreprise, tandis que les hyperscalers verrouillent leurs écosystèmes via Google BigQuery/VertexAI, Amazon Redshift/Sagemaker et Microsoft Fabric.
Avec Lakebase, Databricks s’invite plus clairement sur des usages opérationnels qui, jusque-là, échappaient en partie au périmètre du lakehouse. L’éditeur empiète sur le territoire transactionnel des acteurs historiques : Postgres managé chez AWS (Aurora/RDS), Google (AlloyDB), Microsoft (Azure Database), sans oublier une galaxie de spécialistes. L’angle Databricks n’est pas de remplacer ces offres « à tout prix », mais de proposer une base opérationnelle intégrée là où les équipes veulent construire des apps et des agents au plus près des données gouvernées.
La promesse est séduisante : consolider la stack, raccourcir les chaînes d’intégration, standardiser la gouvernance, accélérer la mise en production des cas d’usage GenAI et agentiques… Autant d’atout qui font désormais de Databricks une vraie plateforme unifiée d’industrialisation des données et de l’IA. Mais la médaille a évidemment son revers : plus la plateforme devient “système de référence”, plus la dépendance augmente, qu’elle soit technologique, contractuelle ou opérationnelle. Les DSI devront donc réfléchir à traiter la stratégie de sortie, la portabilité des données et les modèles de coûts comme des sujets d’architecture, pas comme des détails d’achat. Une remarque qui n’est pas propre à Databricks mais commune à toutes ces offres universelles d’industrialisation et donc également à Microsoft Fabric et Snowflake notamment.
Vers une IPO prochaine ?
Cette levée de fonds en série L annonce-t-elle une IPO imminente ? Pas nécessairement et pas mécaniquement. Néanmoins, tout semble clairement en préparer les conditions : Databricks s’achète ici du temps et de l’optionnalité avec un cash massif et des métriques déjà très “marchés publics” (run rate élevé, forte croissance, free cash flow positif). Mais sa série L a attiré des investisseurs typiquement “crossover” (gérants d’actifs à l’aise entre privé et coté) qui peuvent franchement stabiliser l’actionnariat lors d’une introduction. Le volet de liquidités évoqué pour les salariés ressemble aussi à un mécanisme de “pré-IPO” classique, en réduisant la pression d’un événement de sortie immédiat. Enfin, en finançant l’accélération produit (agents, apps, couche transactionnelle) et d’éventuelles acquisitions, Databricks élargit son histoire et son marché adressable pour arriver, si la fenêtre s’ouvre en 2026, avec un récit plus lisible et une trajectoire encore plus solide.
Avec cette Série L, Databricks ne signe donc pas seulement une nouvelle levée hors normes : l’éditeur impose son récit. Celui d’une plateforme qui ne se contente plus d’orchestrer la donnée, mais qui ambitionne de devenir l’infrastructure de référence pour l’IA agentique.
Reste que cette probable préparation à une IPO soulève en réalité une question plus lointaine : Ces plateformes data/IA arriveront elles au final à prouver qu’elles ne sont pas seulement des « systèmes de référence », mais des catalyseurs d’innovation durable ?





puis