OpenAI ne pouvait rester sans réponse face à la sortie ultra-médiatisée de DeepSeek R1, un modèle ouvert chinois menaçant l’avance technologique de la startup américaine et de son modèle à raisonnement « o1 ». Elle dégaine son successeur dans une version plus performante et moins onéreuse : o3-mini.
En décembre dernier, OpenAI avait dévoilé être en phase de validation et de finalisation d’un modèle à raisonnement « OpenAI o3 » pour succéder à « OpenAI o1 ». Et des partenaires technologiques confirmaient le saut important réalisé démontrant au passage les progrès d’OpenAI dans sa quête à l’AGI, l’intelligence artificielle générale.
Plus rapide, moins coûteux et offrant une précision améliorée par rapport à son prédécesseur, o1-mini, « o3-mini » est désormais accessible à tous, y compris aux utilisateurs gratuits de ChatGPT.
Il s’agit certes d’une version restreinte du modèle « o3 » complet toujours en validation, mais elle s’est montrée dans nos tests déjà très flexible et performante sur une grande variété de cas d’usage.
Des performances accrues et une flexibilité inédite
Grâce à une technique de « chain of thought », le modèle o3-mini procède par étapes pour résoudre des problèmes complexes, en identifiant et corrigeant ses erreurs au fur et à mesure. Ce procédé aboutit à des réponses plus complètes et précises, notamment dans des domaines exigeants comme les mathématiques, le codage ou les sciences. C’est ce même procédé déjà utilisé dans « o1 » et dans le très médiatisé modèle ouvert « DeepSeek R1 ».
OpenAI affirme que, selon leurs tests, o3-mini est capable de répondre 24 % plus rapidement que l’ancien o1-mini.
L’un des points forts de ce nouveau modèle réside dans la possibilité pour l’utilisateur de choisir le niveau de raisonnement souhaité. Via l’API, trois niveaux d’intensité de réflexion sont proposés :
- Bas (Low) : pour des réponses ultra-rapides avec un coût minimal,
- Moyen (Medium) : optimisé pour un équilibre entre vitesse et précision,
- Haut (High) : pour des réponses approfondies et détaillées, bien que plus lentes.
Cette personnalisation permet aux développeurs d’entreprise de s’adapter à une variété de cas d’usage et surtout de coûts, que ce soit pour résoudre des problèmes de haut niveau ou pour obtenir des réponses immédiates sur des requêtes plus simples.
Sur ChatGPT, OpenAI a choisi de n’exposer que deux modes « o3-mini » et « o3-mini high ».
Une chaîne de pensée désormais exposée à tous
L’annonce de o3-mini intervient quelques semaines seulement après la révélation du modèle DeepSeek, lui-même salué pour ses performances à des coûts de formation et d’inférence bien inférieurs. Bien que le débat reste ouvert quant aux chiffres avancés, l’arrivée d’o3-mini confirme la volonté d’OpenAI de repousser les limites de l’IA tout en rendant ses technologies accessibles à tous.
Et déjà, les bonnes idées mises en œuvre par DeepSeek trouvent un écho chez OpenAI. Désormais, tout comme DeepSeek Chat, ChatGPT affiche désormais ouvertement la chaîne de pensée qu’il suit avec tous les détails permettant à chacun de vérifier le raisonnement de ChatGPT alors que jusqu’ici, le chatbot se contentait de dire en 2 mots ce qu’il faisait (« en train de réfléchir », « en train de vérifier »).
Du coup, l’IA d’OpenAI ressemble un peu moins à une boîte noire et son raisonnement ainsi exposé permet éventuellement ensuite de reformuler une requête plus en adéquation avec son processus de réflexion.
Officiellement, les modèles « o3-mini » ont été optimisés pour les raisonnements STEM (Science, Technologie, Ingénierie, Mathématiques) mais ils peuvent néanmoins être utilisés dans des contextes plus larges souvent avec beaucoup de pertinence. Pour les raisonnements plus généraux, « OpenAI o1 » reste disponible. En revanche dès qu’il faut utiliser ChatGPT pour l’analyse de documents ou la recherche Web, seul le modèle « OpenAI GPT4-o » est accessible sur ces usages avancés.
Les abonnés payants à ChatGPT Plus et Team ont d’ores et déjà accès à « o3-mini » (qui correspond au mode médium) et à « o3-mini high », avec une limite de 150 messages par jour pour garantir la qualité du service. Les abonnés à ChatGPT Pro (l’abonnement le plus onéreux) ont accès aux deux nouveaux modèles sans limitation de messages. Les utilisateurs de ChatGPT Gratuit y ont aussi accès en sélectionnant l’option « Reason » lors de la création d’un nouveau prompt.
Une offre repensée pour les développeurs et les entreprises
OpenAI ne se contente pas d’améliorer l’expérience des utilisateurs finaux : le modèle o3-mini est également optimisé pour les développeurs et les entreprises. Disponible via le Chat Completions API, l’Assistants API et le Batch API, il intègre désormais :
- Les appels de fonctions et la prise en charge d’outils externes,
- Des sorties structurées conformes aux schémas JSON, facilitant l’automatisation des workflows,
- Les messages de développeur qui offrent une meilleure flexibilité dans la gestion des instructions.
Et le modèle est aussi disponible sur Azure et son fameux « Azure OpenAI Service » pour tous ceux en quête de confidentialité et de contrôle sur les données et les usages. Microsoft – qui a également la semaine dernière officialisé l’intégration du modèle DeepSeek dans Windows 11 Copilot+ PC et du modèle DeepSeek R1 dans Azure – continue d’être le partenaire de prédilection de la startup américaine. La disponibilité de o3-mini dans Microsoft Azure OpenAI Service marque une avancée significative pour les applications d’entreprise. Les améliorations en termes de latence et de coût – 63 % moins cher que o1-mini et 93 % moins que le modèle o1 – en font une solution particulièrement attractive et compétitive face à DeepSeek pour intégrer une intelligence artificielle de haut niveau dans des environnements professionnels exigeants.
Reste que si l’introduction de capacités de raisonnement avancées ouvre la voie à de nouvelles applications, elle soulève également des enjeux en matière de sécurité. OpenAI a mis en place une technique appelée « deliberative alignment » pour s’assurer que le modèle respecte les politiques internes à chaque étape de son raisonnement. Et o3-mini reste plus performant que les modèles non raisonneurs pour contourner certaines restrictions (« jailbreaking ») et représente ainsi un risque « moyen » en termes d’autonomie du modèle.
OpenAI a par ailleurs précisé que le modèle étendu « OpenAI o3 » serait là dans quelques semaines et que la startup travaillait également au très attendu successeur de son générateur d’image DALL-E 3.