Google Cloud continue de faire de BigQuery le centre vital de son Data Cloud en y intégrant directement de l’IA générative et en proposant un nouvel environnement unifié de data science, BigQuery Studio.
BigQuery, c’est le cœur du Data Cloud de Google, le datawarehouse cloud 100% managé sur lequel Google a bâti toute sa stratégie data et sur lequel reposent bien des services d’analyse de données de Google Cloud.
Alors que des études récentes montrent que 65% des organisations estiment avoir « beaucoup trop » de données à analyser, Google veut simplifier le travail des data scientists et autres data analysts en leur offrant un véritable environnement de développement (SQL, Python, Spark) orienté data, directement au cœur de son datawarehouse, pour rapidement développer, tester et exécuter analyses et algorithmes ML. L’idée derrière BigQuery Studio est d’unifier les univers du « data engineering », du « machine learning » et de l’analytique (analyses prédictives et autres) pour permettre à tous les acteurs de la data de travailler de façon plus collaborative dans un même environnement.
« BigQuery Studio est une nouvelle expérience qui réunit dans un environnement commun aussi bien les personnes qui travaillent sur les données que les personnes qui travaillent sur l’IA et le ML », confirme Gerrit Kazmaier, vice-président et directeur général des données et de l’analyse chez Google.
Avec BigQuery Studio, Google veut imposer BigQuery comme fondation universelle et dé-siloter les équipes data et leur éviter de travailler avec des outils différents pour exploiter les data warehouses, les data lakes, le ML, et la gouvernance des données.
L’environnement permet de découvrir, explorer, analyser et prédire les données avec simplicité et efficacité tout en assurant une gouvernance des données pour respecter conformités et réglementations.
« De grandes quantités de données précieuses sont contenues dans les vidéos, les documents, les fichiers journaux et les enregistrements audio qui peuvent être utilisés avec l’IA générative. Aujourd’hui, nous ajoutons de nouvelles capacités pour unifier vos données d’entreprise structurées avec des données non structurées, ainsi que pour aider à fournir un accès sécurisé, sans avoir besoin de les déplacer » explique Google.
Ainsi, BigQuery Studio s’interface avec Vertex AI mais aussi avec la solution de collaboration autour des Notebooks Python « Google Colab Enterprise » et avec Hex, Deepnote et Jupyter et supporte les formats open source Hudi et Delta Lake.
Parallèlement à BigQuery Studio, Google a également annoncé la possibilité d’utiliser désormais directement les modèles fondamentaux de Vertex AI directement depuis BigQuery ce qui permet d’appeler des inférences de modèles LLM ou autres directement depuis les requêtes SQL afin d’ouvrir de nouveaux horizons.
Enfin, Google va également intégrer son IA générative Duet AI au cœur de BigQuery et Looker afin de permettre à tous dans l’entreprise de réaliser des analyses avancées en exprimant ses besoins en langage naturel. En outre, l’IA peut fournir une expérience contextuelle pour écrire des requêtes SQL ou du code ML, suggérer du code, générer automatiquement des fonctions, recommander des optimisations, etc.