Au lendemain de l’annonce de nouveaux modèles « GPT 4.1 » dédiées à sa plateforme d’API et aux développeurs, OpenAI lance sur ChatGPT deux autres nouveaux modèles à raisonnement, « o3 » et « o4-mini », très intégrés aux fonctionnalités avancées de recherche Web, analyse de données, et compréhension d’images. L’éditeur introduit aussi un nouvel agent « Codex-CLI »…
Décidément, ça bouge beaucoup en ce moment chez OpenAI même si l’entreprise semble avoir du mal à définir une roadmap claire sur le long terme. Après s’être intéressé en début de semaine aux développeurs et aux applications IA d’entreprise avec ses API « GPT 4.1 », OpenAI vient de faire évoluer sa gamme de modèles « o‑series » qu’elle a d’ores et déjà bien intégrée à ChatGPT et à ses fonctionnalités avancées (comme la recherche Web, l’analyse avancée de données, la génération d’images).
« OpenAI o3 » est le modèle le plus doué d’OpenAI. En gestation depuis la fin de l’année dernière, il ne devait jamais être officiellement publié (même si Microsoft l’utilise pour l’agent Deep Research de Copilot for Microsoft 365). Changement de plan pour compenser le retard pris par GPT-5, « o3 » fait son apparition sur les API et dans ChatGPT. Il remplace officiellement « o1 » et devient le nouveau fer de lance du raisonnement approfondi.
« Open AI o4‑mini » remplace « o3-mini » et s’affiche comme une déclinaison allégée de « o3 », pensée pour la réactivité et la maîtrise des coûts. Si « o3 » privilégie la profondeur de réflexion, « o4-mini » privilégie l’efficience.
Des performances avancées
Tous deux dépassent leurs prédécesseurs sur plusieurs benchmarks de référence, de Codeforces à MMMU.
Ainsi, ils montrent significativement meilleurs sur les tâches de programmation et sur la résolution des problèmes mathématiques complexes.
Ils se montrent également largement supérieurs sur les questions scientifiques et de recherche.
Enfin, ils s’avèrent très doués pour analyser les images et les graphiques.
Par leur raisonnement avancé, ces modèles sont préconisés pour animer des agents IA et sont considérés par OpenAI comme les meilleurs piliers actuels pour l’IA agentique.
Le socle fonctionnel de ces deux nouveaux modèles est identique : accès simultané aux APIs Chat Completions et Responses, synthèse de raisonnement intégrée dans la sortie, appel parallèle d’outils — y compris navigation web, exécution Python et génération d’images — et prise en charge native de la vision.
Les équipes d’OpenAI soulignent que « pour la première fois, nos modèles de raisonnement peuvent utiliser de manière autonome tous les outils de ChatGPT », déclaration qu’ils traduisent en démonstrations où l’agent zoome dans un poster scientifique, déclenche une recherche externe puis revient commenter le graphique obtenu.
Les exigences de cybersécurité ne sont pas sacrifiées : nouveaux jeux de refus sur le biorisque, moniteur LLM aligné sur le Preparedness Framework et score de détection avoisinant 99 % lors des campagnes de red‑team internes. Les responsables sécurité apprécieront aussi la traçabilité ; le résumé de raisonnement fourni par l’API peut être journalisé pour l’audit ou l’explicabilité, sans exposer la totalité du contexte utilisateur.
Un agent inattendu : Codex-CLI
En parallèle, OpenAI lance Codex‑CLI, un agent publié en open‑source qui s’exécute localement dans le « terminal » (sous macOS, Linux mais aussi Windows via WSL2). L’idée est minimaliste mais bigrement utile pour les utilisateurs avancés et les développeurs : relier le modèle (o3 ou o4‑mini, GPT‑4.1 à venir) au système de fichiers de l’utilisateur, accepter captures d’écran ou croquis brouillons, puis raisonner sur le code in situ. Pour les environnements sensibles, cette approche évite la copie de dépôts vers un service externe et simplifie l’intégration dans les pipelines CI/CD ou SOC internes.
« Vous pouvez bénéficier du raisonnement multimodal depuis la ligne de commande en envoyant des captures d’écran ou des croquis de faible fidélité au modèle, combiné avec un accès local à votre code. Nous considérons cet agent comme une interface minimale pour connecter nos modèles aux utilisateurs et à leurs ordinateurs. Codex CLI est entièrement open-source et disponible aujourd’hui sur github.com/openai/codex » explique l’éditeur.
La startup a également annoncé une initiative d’un million de dollars pour soutenir des projets similaires dans l’esprit à Codex CLI et utilisant ses modèles OpenAI, avec des subventions de 25 000 dollars sous forme de crédits API.
Pour les DSI et RSSI, o3 devient le choix naturel dès qu’un raisonnement long et multimodal est requis ; o4‑mini prend le relais sur les charges à forte volumétrie où le coût par requête et la latence sont déterminants. Les deux moteurs partagent la même couche de sécurité et la même capacité à orchestrer des outils, ouvrant la voie à des agents hybrides capables de dialoguer, de coder et d’agir sur des systèmes internes tout en restant conformes aux politiques de gouvernance les plus strictes. Pour des usages plus classiques de Chatbot, l’utilisation des API du modèle « GPT 4.1 » (notamment « mini » et « nano ») devra être préconisée car bien moins onéreuse.