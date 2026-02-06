Les deux géants rivaux de l’IA, OpenAI et Anthropic, ont choisi ce 5 février 2026 pour lancer simultanément leurs modèles les plus puissants. Au menu : des agents IA capables de coder, raisonner et travailler en autonomie pendant des heures. Tour d’horizon.

En matière de modèles IA, il y a plusieurs champs de bataille. Celui des modèles conversationnels, celui des modèles générateurs d’image et vidéos, celui des modèles d’analyse vocale, celui de l’OCR intelligent… Mais celui qui concentre aujourd’hui tous les efforts et soulève le plus de promesses, c’est celui des modèles agentiques premium pour l’ingénierie logicielle et le développement applicatif. On ne parle plus seulement d’un assistant qui complète du code, mais d’un collaborateur IA capable de tenir un objectif, d’utiliser des outils, de naviguer dans un dépôt de codes sources et de produire un résultat exploitable, tout en restant pilotable. Coïncidence qui n’en est peut-être pas une, les deux leaders du marché ont sorti simultanément hier soir leurs nouvelles itérations. Un duel au sommet qui illustre toute la tension et toute l’attention autour de ces modèles qui ont déjà très profondément révolutionner le développement logiciel en entreprise. D’un côté, GPT-5.3-Codex, présenté par OpenAI comme « le modèle de codage agentique le plus performant à ce jour ». De l’autre, Claude Opus 4.6, qu’Anthropic positionne comme son intelligence la plus avancée, avec une fenêtre de contexte d’un million de tokens en bêta. Le premier anime OpanAI Codex, le second anime Claude Code, deux des IA agentiques qui font le plus parler d’elles et déchaînent les passions sur les réseaux sociaux.

GPT-5.3-Codex, le modèle qui a contribué à sa propre création

Côté OpenAI, GPT-5.3-Codex est présenté comme le modèle Codex le plus capable à ce jour, avec une promesse simple. Faire mieux que GPT-5.2-Codex sur la performance de code, sans perdre les aptitudes de raisonnement et de travail « bureautique » utiles aux équipes produit de la version GPT-5.2. OpenAI insiste aussi sur un point très concret pour l’utilisateur, la réactivité. Le modèle est annoncé comme 25 % plus rapide dans Codex, avec davantage de retours en cours d’exécution pour éviter l’attente d’un livrable final et permettre de corriger la trajectoire en temps réel. Selon OpenAI, il peut être piloté en temps réel pendant qu’il travaille, un fonctionnement qui se rapproche de celui d’un véritable collègue.

L’autre évolution, plus structurante, tient au périmètre. GPT-5.3-Codex vise le cycle de vie complet du logiciel et, au-delà, des tâches professionnelles menées « sur un ordinateur » comme l’analyse de données ou la production de supports. Autrement dit, le modèle ne se limite plus à écrire du code, il est pensé pour enchaîner recherche, actions et itérations sur la durée (pendant plusieurs heures, voire plusieurs jours).

Autre sujet essentiel, que l’industrie prend de plus en plus au sérieux, la cybersécurité. OpenAI indique classer GPT-5.3-Codex comme son premier modèle « high capability » pour des tâches liées à la cybersécurité, et précise l’avoir entraîné à identifier des vulnérabilités logicielles. L’éditeur dit adopter une approche de précaution, avec une pile de garde-fous renforcée, ainsi qu’un programme pilote d’accès de confiance pour accélérer la recherche défensive.

Sur la disponibilité, GPT-5.3-Codex arrive dans les environnements Codex accessibles via des offres payantes de ChatGPT, notamment l’application Desktop, le web, le CLI et l’extension IDE. L’accès API est évoqué, mais pas encore activé.

Reste le détail qui pourrait commencer à en effrayer plus d’un mais qui en dit long sur le rôle que l’IA joue aujourd’hui dans les développements : GPT-5.3-Codex est le premier modèle à avoir contribué activement à son propre développement. L’équipe Codex a utilisé des versions préliminaires du modèle pour déboguer l’entraînement, gérer le déploiement et analyser les résultats de tests. L’IA qui s’améliore elle-même n’est plus de la science-fiction !

Claude Opus 4.6, le pari du long contexte et du contrôle fin

Chez Anthropic, Claude Opus 4.6 met d’emblée l’accent sur les usages « agentiques » qui s’éternisent, là où les modèles ont tendance à perdre le fil. L’annonce parle d’un modèle qui planifie plus soigneusement, tient plus longtemps des tâches autonomes, opère plus fiablement dans de gros codebases, et progresse en revue de code et en débogage. Signe notable, Opus 4.6 devient aussi le premier modèle « Opus-class » à proposer une fenêtre de contexte de 1 million de tokens (en bêta).

L’approche d’Anthropic est un peu différente. Autant OpenAI décline un modèle « Codex » résolument orienté vers les tâches d’ingénierie, autant Claude Opus 4.6 est le modèle qui anime aussi bien Claude Code que l’assistant Claude AI. Le modèle sert même de moteur à l’autre outil agentique (encore en preview) d’Anthropic, Claude Cowork. Dans ce nouvel environnement agentique, Opus 4.6 peut enchaîner analyses financières, recherche, création de documents, tableurs et présentations de manière autonome.

La tarification reste inchangée par rapport à Opus 4.5 : 5 $/25 $ par million de tokens (entrée/sortie).

Au-delà de la bataille de benchmarks, c’est bien le même signal stratégique qui émerge des deux annonces. OpenAI comme Anthropic ne vendent plus un « chatbot intelligent » ni même un « assistant de code ». Ils vendent un agent de travail autonome, capable de prendre en charge des missions complexes de bout en bout du diagnostic d’un bug en production à l’analyse d’un rapport financier.

Autre nouveauté commune, les deux modèles insistent sur la possibilité de guider l’agent pendant qu’il travaille, de lui poser des questions, de réorienter sa stratégie en cours de route. C’est un changement de paradigme par rapport au prompt unique suivi d’une réponse. Les modèles gagnent non seulement en intelligence et en capacité de raisonnement mais également en interactivité.

Bien sûr, la guerre des agents IA ne fait que commencer. Ce sont les DSI, les développeurs et les équipes métiers qui ont le plus à y gagner mais ils devront déterminer par eux-mêmes lesquels de ces « collègues numériques » conviennent le mieux à leurs cas d’usage.

À lire également :