Alors que les politiques européens s’entendent plus ou moins pour encadrer les IA, les géants américains de la Tech (dont Meta, Google, Amazon) continuent d’accélérer sur les IA génératives avec plusieurs lancements de nouveaux modèles et services. Petit tour d’horizon…

Dans la foulée des annonces de Microsoft sur Copilot, d’Amazon autour de « Q » et du lancement (copieusement truqué) des modèles Gemini de DeepMind/Google, d’autres annonces « IA » sont venues ponctuées la fin d’une semaine célébrant le premier anniversaire de ChatGPT.

Purple LLama, des outils pour des IA génératives plus sûres et fiables

Il y a une dizaine de jours, IBM lançait avec 50 autres partenaires l’initiative « AI Alliance » pour promouvoir l’innovation et la science « ouvertes » en matière d’IA. Parmi les noms de cette alliance, on retrouve Meta (maison mère de Facebook et Instagram) dont le laboratoire FAIR est l’un des pionniers de l’IA générative. On lui doit des modèles réputés comme le LLM « LLaMA 2 », le générateur de code Llama 2, le modèle de génération audio Audiobox, les modèles de traduction « Seamless » ou encore le modèle génératif de vidéos « Emu Video ». Autant de modèles publiés en open source.
Et dans la lignée de l’AI Alliance, Meta vient de lancer un nouveau projet dénommé « Purple LLama». Cette boîte à outils, qui doit s’enrichir avec le temps, est destinée à aider datascientists et développeurs à vérifier l’éthique, la sûreté et la conception responsable des modèles sur lesquels ils travaillent. L’intérêt d’un tel outillage est évident mais prend une nouvelle dimension avec l’accord politique européen du Week-end qui doit mener à un texte final de l’AI Act européen. Ce dernier impose davantage de transparence, documentations et analyses de risques aux modèles, fondations et un tel outillage peut simplifier à terme la conformité à de telles exigences.

« Empruntant un concept au monde de la cybersécurité, nous pensons que pour réellement atténuer les défis que présente l’IA générative, nous devons adopter des postures à la fois offensives (équipe rouge) et défensives (équipe bleue). L’équipe violette, composée de membres de l’équipe rouge et de l’équipe bleue, est une approche collaborative de l’évaluation et de l’atténuation des risques potentiels… » expliquent les équipes IA de Meta avant de préciser « les composants du projet Purple Llama feront l’objet d’une licence permissive permettant à la fois la recherche et l’utilisation commerciale. Nous pensons qu’il s’agit d’une étape importante pour permettre la collaboration entre les développeurs et la normalisation des outils de confiance et de sécurité pour l’IA générative ».

 

Gemini anime l’IA programmeuse Google AlphaCode 2

S’il y a bien un métier où l’IA générative a déjà totalement bouleversé les habitudes, les pratiques, et les processus, c’est bien celui de développeurs. GitHub Copilot, OpenAI Codex, Amazon CodeWhisperer, Tabnine, CodeT5, Polycoder, Codeium, Meta Code LLama, Codiga, … Les IA génératrices de code et assistantes de programmation se multiplient dans le paysage.

La semaine dernière, Google annonçait avec trop de marketing et pas assez de réalisme ses nouveaux modèles Gemini, dont le plus important « Gemini Ultra » ne sera en réalité pas disponible avant plusieurs mois. Et si l’actuel Gemini Pro (pour l’instant restreint au texte et à l’anglais) peine à imposer Bard en alternative à ChatGPT Plus ou Microsoft Copilot, ses capacités de raisonnement promettent de sensibles progrès en développement. Et Google est prêt à le démontrer.
L’éditeur a dévoilé en fin de semaine dernière Google AlphaCode 2. La nouvelle IA s’appuie sur un Gemini Pro spécialisé avec 30 millions d’exemples de codes sources écrits par des humains et des capacités de raisonnement affutées par la résolution de 15.000 problèmes algorithmiques pris de CodeForces.
Selon Google, son IA a été testée sur 77 problèmes de développement soumis parallèlement à 8000 développeurs. Elle a intégralement résolu 43% d’entre eux, soit deux fois plus que sa première génération d’IA AlphaCode. Surtout, il fait mieux que 85% des développeurs humains évalués en parallèle. Et sur deux des problèmes, l’IA a fait mieux que 99,5% des participants.

Reste à savoir si AlphaCode 2 connaîtra une destinée plus publique qu’AlphaCode 1 resté une expérimentation. Apparemment, Google n’a pas forcément l’intention d’en faire un produit « à part », mais plutôt d’intégrer ces capacités dans Gemini Ultra et ses IA « Duet AI ».

 

Amazon Titan Image Generator affronte Dall-E, Firefly et Midjourney

Il y a une dizaine de jours, AWS dévoilait à l’occasion de sa conférence « Re:Invent 2023 » ses innovations en matière d’IA générative à commencer par son LLM « Amazon Q » destiné aux entreprises.

Au passage, l’éditeur annonçait de modèles fondation maison sous le patronyme Titan accessible depuis son API universelle Bedrock. Titan Image Generator est le dernier-né des modèles estampillés « Titan ». Comme Dall-E d’OpenAI ou Firefly d’Adobe, cette IA peut générer des images à partir d’une description textuelle. Avec ce modèle, AWS veut permettre à n’importe quel développeur d’intégrer non seulement des fonctions de génération d’images à leurs applications mais également des fonctions intelligentes d’édition d’images.
Typiquement « Titan Image Generator » ne se contente pas de créer des images mais propose aussi des options de « inpainting » permettant de masquer une zone existante pour la faire régénérer par l’IA (pour supprimer un élément ou remplacer un élément visuel par un autre) mais aussi de « outpainting » pour par exemple étendre l’arrière-plan d’une image sous-dimensionnée. Le modèle permet aussi d’imposer des contraintes de personnalisation pour que les images générées s’alignent sur une charte graphique ou un style particulier.