Un peu dépassé par le buzz autour des IA génératives telles que Dall-E et ChatGPT, Google prépare une contre-attaque en appui sur les recherches menées par ses chercheurs et ceux de DeepMind avec Muse et Sparrow.

Les fulgurants progrès réalisés par les modèles génératifs d’OpenAI et notamment par l’IA de génération d’images Dall-E 2 et l’IA conversationnelle ChatGPT ont étonné le monde entier et, apparemment, pris de cours Google. Le leader de la recherche a immédiatement perçu ChatGPT comme une technologie concurrente dangereuse et déclenché un « Code Red » pour rapidement apporter ses propres avancées technologiques dans ces domaines.

D’un côté, les chercheurs de Google AI viennent de publier un nouveau papier de recherche autour de Muse, une nouvelle IA générative d’images à partir de texte. Contrairement à Dall-E ou Stable Diffusion, deux IA s’appuyant sur des techniques dites de diffusion, Muse s’appuie sur un nouveau modèle MGT (Masked Generative Transformers) capable de produire des images photoréalistes et dont les résultats pourraient se révéler plus originaux.

Surtout, Muse s’annonce significativement plus rapide que les IA actuelles de génération d’images telles que Dall-E, Imagen ou encore l’autre IA générative de Google, Parti, utilisant des modèles régressifs. Avec un seul accélérateur TPUv4, il faut une demie seconde à Muse pour générer une image de 256×256 pixels contre 9 secondes pour Imagen par exemple. Selon les chercheurs, Muse serait également trois fois plus rapides que Stable Diffusion.

Parallèlement, DeepMind (une des startups d’Alphabet, acquise il y a 9 ans et largement financée par Google) a confirmé travailler sur une intelligence artificielle concurrente de ChatGPT et connue sous le nom de Sparrow. Demis Hassabis, le CEO de DeepMind, a ainsi confirmé au Time préparé une version « Beta » dans le courant de l’année 2023.

Si OpenAI a focalisé les attentions du grand public, DeepMind a attiré l’attention de spécialistes notamment avec son IA de génération de code (Alphacode) et plus encore avec son IA AlphaFold capable de prédire les structures 3D de toutes les protéines connues.
Son Sparrow s’annonce très prometteur. Mais DeepMind ne veut pas aller trop vite et veut éviter certains écueils mis en avant par ChatGPT. Typiquement, Sparrow devrait être capable de citer les sources qui inspirent ses « réponses ». Tout comme ChatGPT, Sparrow ne cherche pas à se faire passer pour un humain et multiplie les règles de contrôle pour éviter de se montrer impoli, rude, discriminatoire, ou simplement donner des réponses inappropriées. Néanmoins, tout comme ChatGPT, Sparrow semble avoir une approche tangentielle de la vérité et peut lui aussi affabuler ou donner des réponses à côté de la plaque.

À lire également :

SantaCoder, une IA codeuse qui évite de violer les copyrights

Microsoft veut renforcer son partenariat OpenAI et intégrer ChatGPT à Microsoft 365

Microsoft veut intégrer ChatGPT à Bing pour concurrencer Google

L’IA au cœur du futur Windows 12 ?