La première vraie journée de Re:Invent 2024 a été marquée par une pluie d’annonces autour de l’IA. AWS a notamment annoncé Sagemaker Unified Studio et Sagemaker Lakehouse afin de disposer d’une plateforme IA à même de tenir la dragée haute à Vertex AI de Google Cloud et Azure AI Foundry de Microsoft.
L’air de rien, cela va déjà faire près d’une décennie qu’AWS a lancé sa plateforme Sagemaker pour aider à la création et au déploiement du ML puis des modèles IA dans les entreprises. Sauf que l’IA d’il y a 10 ans n’a plus grand-chose à voir avec l’IA et ses cas d’usage aujourd’hui.
Et même si Sagemaker n’a cessé d’évoluer et de s’adapter, la solution d’Amazon était désormais souvent présenté comme en retard face à la popularité étonnante de Vertex AI (la plateforme ML/IA de Google Cloud) et la complète mais récente plateforme « Azure AI Foundry » Microsoft.
AWS a donc mis les bouchées doubles pour proposer à l’occasion de son Re:Invent 2024 une refonte majeure d’Amazon SageMaker qui vise bien évidemment à favoriser le déploiement des cas d’usage de l’IA dans les entreprises mais ambitionne également d’unifier l’ensemble des outils d’analytique et d’IA dans un environnement cohérent et intégré.
« Le tout nouveau SageMaker inclut virtuellement tous les composants nécessaires pour l’exploration, la préparation et l’intégration des données, le traitement des données massives, l’analyse SQL rapide, le développement et l’entraînement des modèles de machine learning (ML), ainsi que le développement d’applications d’IA générative » résume Antje Barth, Principal Dev Advocate Gen AI chez AWS.
Un studio unifié…
Au cœur de cette évolution se trouve SageMaker Unified Studio, une nouvelle interface qui centralise l’accès aux données et aux outils de développement. Selon Amazon, cette refonte répond à un constat simple : les utilisateurs de SageMaker combinent déjà régulièrement les outils d’analytique avec le développement d’IA. La plateforme unifie désormais les fonctionnalités auparavant dispersées entre Amazon Bedrock, EMR, Redshift et AWS Glue.
Sur la forme, SageMaker Unified Studio vise aussi à faciliter la découverte et l’accès aux données à travers l’organisation en réduisant les silos de données, à réduire le temps nécessaire pour accéder aux fonctionnalités d’analyse et d’IA, et à favoriser la collaboration interne en permettant aux équipes de collaborer plus facilement sur des projets de données et d’IA au sein d’un même un environnement partagé.
… sur un Lakehouse unificateur
Seconde brique clé de ce SageMaker réinventé, l’introduction de SageMaker Lakehouse représente une avancée significative dans la gestion des données au sein de cet environnement. Cette solution permet aux entreprises d’accéder et d’analyser leurs données provenant de différentes sources sans nécessiter de déplacement complexe. « Amazon SageMaker Lakehouse unifie les données d’Amazon S3 et Amazon Redshift pour des analyses et applications d’IA/ML puissantes à partir d’une seule copie de données » explique AWS. Ce Lakehouse permet d’accéder et d’interroger les données en place avec des outils compatibles Apache Iceberg, de sécuriser les données avec des permissions granulaires, et d’intégrer des données en temps quasi réel sans ETL. Il offre également des capacités de requêtes fédérées sur des sources de données tierces.
De la gouvernance pour les données et l’IA
La gouvernance des données n’est pas en reste avec SageMaker Catalog (et ces centaines de modèles approuvés), construit sur Amazon DataZone, le service qui permet de s’assurer que les bonnes données sont accessibles par les bonnes personnes, en conformité avec les réglementations de sécurité et d’éthique de l’organisation. Cette solution permet un contrôle granulaire des accès aux modèles d’IA et aux données, tout en intégrant des garde-fous pour prévenir les biais et les comportements toxiques des applications d’IA.
Autre brique repensée, SageMaker Data Processing permet d’analyser, préparer et intégrer des données pour l’analytique et l’IA depuis ce nouvel environnement unifié en s’appuyant sur des frameworks open source et sur Amazon Athena, Amazon EMR et AWS Glue.
L’intelligence artificielle s’intègre naturellement dans cet écosystème avec tous les outils utiles pour construire, entraîner, personnaliser, déployer des modèles ML et génératifs en appui sur le très populaire environnement Amazon Bedrock mais aussi sur l’assistant IA « Amazon Q Developer » ici totalement intégrer afin non seulement de favoriser la prise en main de l’environnement mais aussi faciliter la découverte et l’analyse des données à partir de prompts. Les développeurs peuvent désormais interroger leurs données en langage naturel et obtenir des réponses précises, accompagnées de requêtes SQL générées automatiquement.
Swami Sivasubramanian, Vice-Président Data et IA chez AWS, souligne que cette évolution répond à la convergence croissante entre l’analytique et l’IA. Les entreprises ont besoin d’accéder à des sources de données de plus en plus interconnectées pour alimenter leurs modèles d’IA et leurs analyses.
Cette nouvelle génération de SageMaker est disponible dans plusieurs régions AWS majeures, notamment en Amérique du Nord, en Europe et en Asie-Pacifique. AWS propose également des intégrations « zero-ETL » avec diverses applications SaaS, simplifiant considérablement l’incorporation de données externes dans les workflows d’IA et d’analytique.
Avec ce nouveau SageMaker « unifié », AWS promet ainsi aux entreprise une expérience unifiée où données, analytique et intelligence artificielle convergent dans un environnement cohérent et sécurisé. Une proposition qui ne peut que séduire les entreprises…