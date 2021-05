Google est décidément très actif sur les données cloud en ce moment. Après l’annonce d’une nouvelle plateforme MLOps dénommée VectraAI Lors de Google I/O, Google Cloud lance trois nouveaux services venant enrichir sa plateforme Data.

Google Cloud muscle sa plateforme de données afin d’aider les entreprises à davantage unifier dans le cloud leurs bases de données, leur décisionnel et leurs projets IA et tirer ainsi davantage d’insights et de valeurs de leur patrimoine informationnel.

Trois nouveaux services Data viennent enrichir la galaxie de solutions de Google Cloud :

Dataplex est une nouvelle solution de gouvernance des données dans un monde où les informations sont désormais réparties dans une grande diversité de datawarehouses, data lakes, data marts. Elle veut aider l’entreprise à rapidement gérer, nettoyer, sécuriser, intégrer et analyser les données à grande échelle. Elle s’appuie pour cela sur des fonctionnalités IA et ML de Google, sur l’élasticité de GCP et sur des technologies open-source comme Apache Spark et Presto. Une solution qui s’inscrit dans l’air du temps avec les annonces récentes d’IBM autour d’AutoSQL ou encore celle de Microsoft avec Azure Purview.

Datastream est un nouveau service Serverless de réplication et de capture de changements de données (CDC). Il permet une réplication intelligente et en temps-réel des flux de données, depuis des bases de données hétérogènes comme Oracle ou MySQL vers les services de données de Google Cloud à commencer par BigQuery, Cloud SQL ou Cloud Spanner. Actuellement en preview, le service sera progressivement étendu à d’autres sources de données « on premises » telles que DB2, Postgres, MongoDB… Il s’impose comme une brique essentielle pour les applications de décisionnel temps réel et les architectures « event-driven » notamment celles basées sur Google Cloud Functions. Google propose donc ainsi sa propre solution d’intégration et ETL à même de concurrencer des solutions comme Azure Data Factory, BryteFlow, FiveTran ou Oracle GoldenGate.

Enfin, Analytics Hub est un nouveau service décisionnel managé construit au-dessus de BigQuery et apparemment très orienté vers le partage de données et d’insights qui s’inscrit dans une volonté des entreprises de multiplier les accès sécurisés et contrôlés aux données tout en évitant les copies multiples.

Autant de nouveaux services qui viennent enrichir une plateforme de données de plus en plus complète et cohérente à même de donner du fil à retordre à AWS, Azure (et son Synapse Analytics) ou encore Snowflake.