On ne s’y attendait pas forcément mais le spécialiste des bases NoSQL Cassandra, DataStax, va être racheté par IBM pour renforcer le portfolio « watsonx ». Au passage, IBM récupère ainsi le populaire outil low-code en open source Langflow permettant de créer des agents et des workflows d’automatisation pilotés par l’IA.
IBM a annoncé cette semaine l’acquisition de DataStax, un fournisseur de solutions de données et d’IA. Cette acquisition stratégique vise à enrichir la suite de produits et services IA watsonx d’IBM pour encore plus aider les entreprises à exploiter pleinement leurs données non structurées dans le cadre de leurs applications IA.
DataStax, fondée en 2010 et basée à Santa Clara (Californie), est reconnue pour ses technologies AstraDB (une base de données managée DBaaS basée sur Apache Cassandra) et DataStax Enterprise (une distribution Cassandra « on-premises » enrichie d’outils d’entreprise). Pour rappel, Apache Cassandra est une base de données NoSQL distribuée, publiée en open-source, conçue pour gérer de grandes quantités de données sur plusieurs serveurs avec une haute disponibilité et une scalabilité sans compromis sur les performances.
Les dernières évolutions des bases DataStax combinent les capacités des bases de données graphes et vectorielles, offrant ainsi une solution multi-modèle qui supporte les données graphes, les modèles clé-valeur, tabulaires et documentaires JSON. Cela permet une flexibilité maximale pour les développeurs d’applications d’IA.
Mais DataStax est également très engagé dans le soutien d’autres communautés open-source à commencer par son outil Low-Code « Langflow » (issu du rachat de Logspace) qui vise à simplifier le développement d’applications d’IA en offrant une interface visuelle intuitive et des intégrations flexibles avec divers modèles, API et bases de données. Basé sur Python et agnostique par rapport aux modèles, API ou bases de données, LangFlow accélère le développement d’agents IA et les applications exploitant la génération augmentée par récupération (RAG).
Outre Langflow, DataStax est également très investi dans le développement d’Apache Pulsar (plateforme de messagerie de type pub/sub) et OpenSearch (le fork d’ElasticSearch initié par AWS).
Alors bien sûr, l’annonce de ce rachat n’a pas manqué de rapidement créer des émois dans l’univers open source. IBM a d’ailleurs pris les devants en assurant déjà qu’elle allait poursuivre le soutien et l’innovation avec toutes les communautés open-source dans lesquelles DataStax est impliquée. Cet engagement s’inscrit dans la continuité de la stratégie d’IBM en matière d’open-source avec Red Hat et d’IA open-source avec notamment ses modèles fondamentaux IBM Granite et son Instruct Lab.
Exploiter les données non structurées pour l’entreprise
Le rachat de DataStax par IBM a certainement du sens pour ce dernier même si avec DB2, Netezza, Informix, watsonx.data et les services managés « Databases for » (pour PostgreSQL, MySQL, MongoDB, Cloudant…), l’éditeur était déjà bien armé.
Pour rappel, depuis son split, IBM a recentré sa stratégie autour du cloud hybride et de l’IA, les « deux technologies les plus transformatrices pour les entreprises aujourd’hui », selon son CEO Arvind Krishna. IBM a lancé la plateforme Watsonx en 2023 afin de fournir aux entreprises des outils pour le cloud, les données et l’IA (notamment des modèles d’IA générative) sur une infrastructure flexible tout en privilégiant une approche ouverte et multi-cloud. L’acquisition de DataStax s’inscrit dans cette orientation : en intégrant une technologie de base de données NoSQL distribuée à grande échelle, très prisée dans l’univers des données non structurées, IBM renforce son offre pour aider les clients à exploiter leurs données dans le cloud et en tirer de la valeur via l’IA.
« Les entreprises ne peuvent pas réaliser le plein potentiel de l’IA générative sans l’infrastructure adéquate – des outils et technologies open-source qui autonomisent les développeurs, exploitent les données non structurées et fournissent une base solide pour les applications d’IA », explique Dinesh Nirmal, Senior Vice President d’IBM Software, pour qui la base de données vectorielle de DataStax excelle dans l’exploitation des données d’entreprise non structurées.
En somme, avec AstraDB, DataStax apporte à IBM une couche de gestion de données moderne, distribuée et temps réel parfaitement complémentaire de ses ambitions en IA. Watsonx.data gagnera en performance et en flexibilité, devenant un véritable lakehouse intelligent capable de gérer « toutes les données, partout » pour l’analytique et l’IA.
Par ailleurs, mais c’est une évidence, LangFlow est sans aucun doute une adjonction pertinente à l’écosystème watsonx.
Enfin, en s’appropriant DataStax, IBM acquiert non seulement une technologie alignée sur sa vision (cloud-natif, multi-cloud, open source), mais aussi une base installée de clients grands comptes (FedEx, Capital One, Verizon, etc.) qui utilisent Cassandra pour des applications critiques
Les détails financiers de la transaction n’ont pas été divulgués. L’acquisition devrait être finalisée au second trimestre 2025, sous réserve des conditions de clôture habituelles et des approbations réglementaires.