L’intelligence artificielle (IA) était – comme on pouvait s’y attendre – un sujet très transversal de la conférence Google Cloud Next’22 couvrant des domaines comme la productivité au quotidien, l’industrie 4.0 et les data-sciences.
Simplifier l’accès à l’intelligence artificielle est un leitmotiv de tous les clouds, même si chacun y va un peu à sa façon. Pas étonnant dès lors que nombre d’annonces phares de ce Google Cloud Next’22 qui se tient cette semaine tournent effectivement autour des cas d’usages de l’IA et des moyens de la rendre plus immédiatement accessible aux entreprises.
Multiplier les cas d’usage de la vision par ordinateur, améliorer la productivité de chacun, offrir aux data-scientists de nouveaux outils… Tels étaient les trois grands axes d’annonces de Google à l’occasion de cet événement.
Vertex AI Vision pour interpréter les flux vidéos
Google annonce Vertex AI Vision une nouvelle extension de son environnement de développement ML/IA dédiée cette fois à l’analyse d’images et de flux vidéo. Objectif, simplifier et accélérer la création et le déploiement d’applications de vision par ordinateur que ce soit pour l’industrie 4.0 (typiquement pour le contrôle de pièces ou le respect des règles de sécurité sur les sites), la santé, le retail (surveillance et inventaire automatique des stocks), etc.
Google explique que « Vertex AI Vision peut réduire le temps de création d’applications de vision par ordinateur qui prenaient jusqu’ici plusieurs semaines à quelques heures seulement, pour un coût dix fois inférieur à celui des offres actuelles. Pour réaliser ces gains d’efficacité, Vertex AI Vision propose une interface ‘drag and drop’ facile à utiliser et toute une bibliothèque de modèles ML pré-entraînés pour des tâches courantes telles que le comptage d’occupation, la reconnaissance de produits et la détection d’objets. Par ailleurs, la solution permet aussi d’importer dans vos applications Vertex AI Vision, vos modèles AutoML existants ou vos modèles ML personnalisés issus de Vertex AI ».
Des AI Agents pour améliorer la productivité de tous
Il y a ceux qui disposent des compétences pour développer leurs propres IA spécifiquement adaptées à leurs besoins. Et il y a ceux qui n’ont pas les compétences et recherchent des services « clés en mains » qu’ils pourront appeler depuis leurs applications métiers. Si Vertex AI Vision s’adressent typiquement aux premiers, les nouveaux « AI Agents » de Google Cloud s’adressent eux aux seconds.
« Il s’agit de technologies qui permettent aux clients d’appliquer le meilleur de l’IA à des défis commerciaux courants, avec une expertise technique limitée » explique ainsi Google.
À Google Cloud Next’22, l’hyperscaler a annoncé « Translation Hub », un service de traduction en self-service pour traduire des documents en 135 langues à l’échelle de l’entreprise.
Translation Hub combine la technologie Google Cloud AI, la traduction automatique neuronale de Google et la technologie AutoML, pour faciliter l’ingestion et la traduction de contenus à partir des types de documents d’entreprise les plus courants, notamment Google Docs et Slides, les PDF et Microsoft Word.
Ce Hub permet de gérer efficacement les traductions. La traduction préserve les mises en page et le formatage. Le Hub fournit des contrôles de gestion granulaires (notamment en matière de sécurité et de contrôle des coûts) et permet une révision interactive des documents par les collaborateurs. Les différents services de l’entreprise peuvent créer leurs propres glossaires, enregistrer ce que Google appelle des « mémoires de traduction » (autrement dit, apprendre à l’IA à retenir comment un ensemble de mots ont été corrigés et traduits par les collaborateurs au moment de la révision des traductions automatiques), personnaliser l’IA de traduction avec AutoML.
Translation Hub est disponible sous deux formes d’abonnement : Basic et Avancé. La post-édition des contenus traduits, l’intégration des modèles AutoML et les mémoires de traductions sont des fonctionnalités réservées à l’abonnement « Avancé ».
Outre Translation Hub, Google a présenté des améliorations à deux services existants désormais désignés comme « AI Agents ».
– Document AI permet d’automatiser le traitement de documents en créant des workflows d’analyse. Cet AI Agent s’enrichit de deux fonctionnalités : « Document AI Workbench » pour simplifier l’extraction d’information depuis des documents non structurés (en créant vos propres modèles) et « Document AI Warehouse » qui permet de chercher, stocker et gouverner des métadata (pour mieux automatiser la classification des documents par exemple).
– Contact Center AI un agent intelligent pour répondre à tous les besoins des centres de contact de l’acheminement intelligent des clients à l’analyse des transcriptions en passant par le dialogue avec des bots.
De l’open-source et un nouveau CPU
Dernier volet des annonces IA, Google Cloud enrichit son offre à destination des data-scientists. L’hyperscaler a annoncé une nouvelle initiative fruit d’une collaboration entre Google et des acteurs comme Meta, AMD, ARM, Intel et NVidia afin d’éviter l’adhérence des modèles à des plateformes ou des technologies matérielles.
Objectif avoué de cette alliance : mettre fin aux incompatibilités entre les frameworks et les accélérateurs IA et simplifier le déploiement de modèles ML provenant de différents frameworks (à commencer par PyTorch et TensorFlow) sur différentes architectures matérielles (CPU, GPU, ASIC).
Première concrétisation de cette initiative, le compilateur XLA propre à TensorFlow est désormais découplé de TensorFlow et devient un projet open source dénommé OpenXLA.
Autre annonce, cette fois directement liée aux infrastructures IaaS de Google Cloud, l’hyperscaler lance une nouvelle génération de machines : les C3 VM.
Leur particularité ? Elles s’appuient sur un SoC (System on Chip) co-développé par Intel et Google. Ce SoC (dénommé E2000) combine un Xeon Scalable de 4 ème génération (les fameux Sapphire Rapids toujours en attente de lancement officiel) et une unité IPU (Infrastructure Processing Unit) inventée par Google et chargée d’optimiser et sécuriser les flux réseaux sans intervention du CPU. Ces nouvelles VM « C3 » sont notamment préconisées pour les travaux sur la data qui nécessitent haute performance et haute confidentialité.
À lire également autour de Google Cloud Next’22 :
Google unifie ses outils BI et ML sous la bannière Looker et monte en puissance sur la data
Google aussi veut déplacer vos workloads mainframes vers le cloud