OpenAI démontre une nouvelle fois qu’il maîtrise les technologies d’IA générative mieux que tous les autres. Dérivé de son générateur d’images fixes DALL-E 3, son nouveau modèle Sora génère des vidéos spectaculaires à partir de simples requêtes textuelles. 

L’IA générative ne cesse de nous époustoufler et de nous inquiéter aussi par son potentiel de plus en plus impressionnant et varier. Avec GPT-4, on a découvert qu’elle savait manier les mots avec une étonnante dextérité. Avec ChatGPT, on a compris qu’il serait désormais plus facile de dialoguer avec les machines qu’avec les êtres humains. Avec DALL-E 3, chaque utilisateur s’est transformé en artiste créatif capable d’illustrer n’importe quel post sur les réseaux sociaux ou n’importe quel texte, voire de berner le monde avec de fausses photos étonnamment réalistes.

On savait aussi grâce à Google notamment avec son IA Phenaki, grâce à Meta et son IA « Make-A-Video » ou encore grâce à Runway et son IA « Gen-2 », que les IA génératives pouvaient être utilisées pour produire des vidéos à partir d’un simple prompt textuel.

Mais, depuis hier, le monde est entré dans une nouvelle dimension avec SORA.

SORA c’est le nouveau modèle génératif d’OpenAI. SORA est à la vidéo ce que DALL-E 3 est à l’image et la photo. Le modèle convertit un prompt (une description textuelle) en une séquence vidéo Full HD d’une durée allant jusqu’à 1 minute. Et le résultat est impressionnant!

Saisissez une description d’une scène telle que : « La scène animée présente un gros plan d’un petit monstre pelucheux agenouillé à côté d’une bougie rouge en train de fondre. Le style artistique est 3D et réaliste, l’accent étant mis sur l’éclairage et la texture. L’ambiance de la peinture est à l’émerveillement et à la curiosité, le monstre regardant la flamme avec de grands yeux et la bouche ouverte. Sa pose et son expression traduisent un sentiment d’innocence et d’espièglerie, comme s’il explorait le monde qui l’entoure pour la première fois. L’utilisation de couleurs chaudes et d’un éclairage dramatique renforce l’atmosphère chaleureuse de l’image ».

Et vous obtenez ça :

 

Saisissez le prompt : « La belle ville enneigée de Tokyo est en pleine effervescence. La caméra se déplace dans une rue animée de la ville, suivant plusieurs personnes qui profitent du beau temps enneigé et font leurs courses dans les échoppes voisines. De magnifiques pétales de sakura volent dans le vent, accompagnés de flocons de neige. »

Et vous obtenez ça :

 

Bluffant, non ?

Évidemment, les démonstrations d’OpenAI montrent son IA sous son meilleur jour. Ce n’est qu’une première version du modèle et tout n’est pas parfait.

D’ailleurs, SORA n’est pour l’instant qu’un projet de recherche non ouvert au public. Car il soulève beaucoup d’interrogations et d’inquiétude tant il risque de bouleverser l’univers du cinéma, du court métrage, du dessin animé et de la publicité vidéo.

Ses mauvais usages pourraient aussi avoir des impacts dramatiques en cette année d’élections un peu partout dans le monde.

C’est pourquoi son accès est pour l’instant limité à des chercheurs en sécurité des IA et à quelques sociétés de productions et artistes afin de permettre à OpenAI de mieux en cerner les potentiels, les limites et les risques.

Néanmoins, SORA promet de nous en mettre plein la vue dans les prochaines semaines et les prochains mois !

 

 

À lire également :

OpenAI donne de la mémoire à ChatGPT

OpenAI lance son (très attendu) GPT Store : découvrez les premiers GPTs super utiles…

OpenAI lance DALL-E 3 et Microsoft le rend disponible

DALL-E 2 : L’IA comme générateur d’Art