Outre le lancement de GPT 4.5, OpenAI avait une autre bonne surprise à annoncer : son fameux modèle SORA est désormais (enfin !) accessible aux européens !
Semaine intense pour OpenAI qui a consécutivement généralisé au monde entier sa fonctionnalité agentique « Deep Research », lancé son nouveau modèle GPT 4.5 et qui vient donc également d’ouvrir enfin l’accès à sa technologie Sora aux européens.
Lancé le 10 décembre dernier, Sora n’était jusqu’ici pas accessible aux français et aux utilisateurs européens, le temps qu’OpenAI assure la compatibilité de son service aux exigences européennes et notamment au RGPD et à l’AI Act. Il aura donc fallu plus de deux mois à la startup américaine pour s’assurer de la conformité de son service.
Sora, c’est le modèle de génération vidéo d’OpenAI, conçu pour transformer des descriptions textuelles, des images ou des vidéos en nouvelles séquences vidéo. Grâce à son architecture avancée, Sora peut créer des vidéos de haute qualité, en interprétant des scènes complexes avec plusieurs personnages et des mouvements de caméra fluides. Les utilisateurs peuvent également modifier des vidéos existantes en remplaçant ou en réimaginant des éléments spécifiques. Dit autrement, Sora est à la fois un outil de création et de retouche de vidéos par l’IA.
Capacités de Sora
Sora excelle dans la génération vidéo à partir de texte. Le modèle gère des scènes complexes avec de multiples objets et personnages en mouvement. Il sait maintenir la cohérence visuelle à travers les mouvements et possède une compréhension rudimentaire des interactions physiques.
Sa multi-modalité permet en pratique trois approches différentes : la génération à partir de texte, l’animation d’images fixes, ou la modification/prolongement de vidéos existantes. Les fonctionnalités incluent le remixage, l’extension temporelle et la création de transitions fluides entre clips. Des styles visuels prédéfinis et la création de boucles parfaites viennent également enrichir l’expérience créative.
Limitations connues
Malgré ses avancées, Sora présente encore d’importantes limitations : une reproduction imparfaite des lois physiques, des incohérences temporelles sur les séquences longues ou complexes, et une certaine difficulté à maintenir la cohérence narrative pour des actions élaborées. En pratique, plus la séquence à générer est courte, moins ces défauts sont visibles. De même, le modèle peine (comme Dall-E) à générer des textes.
OpenAI a également implémenté des restrictions strictes contre les deepfakes non autorisés, contenus inappropriés et autres utilisations problématiques, limitant certains cas d’usage mais assurant une utilisation responsable de son outil, ce que lui impose l’AI Act européen.
Des capacités variables selon l’abonnement
Pour accéder à Sora, il suffit de souscrire à ChatGPT Plus ou à ChatGPT Pro, puis de se connecter avec un navigateur Web sur le site dédié : https://sora.com/library. Même si Sora utilise sa propre interface Web, son accès reste conditionné à un abonnement payant à ChatGPT.
Une fois connecté, les utilisateurs peuvent consulter une bibliothèque d’exemples très parlants, générer des vidéos en saisissant des descriptions textuelles détaillées ou en téléchargeant des images ou des vidéos à modifier. Sora propose également des fonctionnalités telles que « Remix » pour ajuster les vidéos générées, « Storyboard » pour organiser des séquences sur une chronologie, et « Loop » pour créer des vidéos en boucle sans interruption perceptible.
Les fonctionnalités de Sora varient cependant selon l’abonnement ChatGPT choisi :
– Avec l’abonnement « Plus » (à 20 $ par mois), les utilisateurs bénéficient de 50 vidéos prioritaires par mois (1 000 crédits), avec une résolution allant jusqu’à 720p et une durée maximale de 5 secondes. Les vidéos générées sont marquées d’un filigrane SORA.
– L’abonnement Pro à 200 $ par mois offre jusqu’à 500 vidéos prioritaires (10 000 crédits), des générations illimitées en mode relaxé, une résolution atteignant 1080p, une durée maximale des séquences de 20 secondes, la possibilité de télécharger le résultat sans filigrane et de réclamer jusqu’à cinq générations simultanées.
Bienvenue dans un nouveau monde de création vidéo par l’IA. On rappellera que Sora n’est pas la seule IA capable de générer des vidéos. Le modèle d’OpenAI se confronte notamment à Veo2 de Google, MovieGen de Meta, Runway, Lumen5 et plusieurs autres…