Un nouveau modèle de génération d’images répondant au nom de code « Red_Panda » fait vibrer la toile et l’écosystème IA. Publié pour l’instant anonymement pour recueillir le feedback de testeurs, le modèle fait mieux que Dall-E, Midjourney ou le nouveau Black Forrest.
Connu sous le nom de « red*panda », un nouveau modèle open source fait une apparition remarquée sur le site de benchmarking participatif Artificial Analysis. Ce modèle génératif « Text to Image » permet de créer des images à partir de description textuelle à l’instar des célèbres Dell-E d’OpenAI, Imagen de Google, Firefly d’Adobe ou Midjourney.
Les modèles génératifs d’image ont le vent en poupe. Et nombres de startups et d’éditeurs tentent d’imposer de telles IA à même de métamorphoser le travail des créatifs et de réinventer la chaîne de création de contenus marketings.
Il y a quelques semaines, un nouveau modèle anonyme étonnait déjà par ses prestations avant d’être officialisé par la startup Black Forest Labs sous le nom de « Flux 1.1 Pro ».
Mais ce modèle qui tenait largement tête à Dall-E et Midjourney vient d’être détrôné au classement d’Artificial Analysis par un nouveau modèle anonyme qui le surpasse avec 40 points d’avance ! Le classement s’appuie sur l’avis d’utilisateurs-testeurs qui évaluent la qualité et la précision des images produites à partir des prompts.
Qui se cache derrière Red_Panda ?
Et « Red_Panda » surpasse ses concurrents non seulement en matière de qualité des productions mais également en vitesse de génération ! Il est ainsi l’un des plus rapides du classement et 100 fois plus rapide que Dall-E 3!
De quoi forcément éveiller la curiosité de la communauté, qui se demande déjà quelle entreprise se cache derrière ce nouveau modèle. Chacun y va de sa prédiction. Pour certains, cela pourrait être la prochaine version de Dall-E d’OpenAI, startup qui a régulièrement glissé certains de ces modèles en avance de phase sur les sites d’évaluation participatifs. D’autres verraient bien un nouveau modèle de Meta. Certains y voient l’œuvre d’un grand de l’IA Chinois comme Baidu ou Tencent qui voudraient marquer un grand coup pour leurs premiers pas dans la génération d’images, d’autant que les Chinois ont déjà montré leur savoir-faire avec les plateformes vidéo GenIA comme Kling et MiniMax. Est-ce que cela pourrait ne pas être un modèle d’une startup européenne comme Mistral AI et qui pourrait ainsi être accessible en open-source ?
La réponse probablement dans quelques semaines…