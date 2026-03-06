Deux jours seulement après GPT-5.3 Instant, OpenAI lance GPT-5.4, son nouveau modèle de référence décliné en versions Thinking et Pro. Objectif affiché, faire de l’IA générative un véritable outil quotidien des professionnels capable de piloter Excel et des tâches toujours plus complexes.

Il y a 48 heures, OpenAI lançait GPT-5.3 Instant, le nouveau modèle par défaut des conversations sur ChatGPT pour rendre les conversations plus fluides, plus naturelles, plus agréables. Des améliorations qui visaient essentiellement les usages personnels de ChatGPT.

Hier soir, OpenAI a surpris tout le monde en lançant pour les abonnements payants de ChatGPT ses deux nouveaux modèles à raisonnement approfondi, GPT-5.4 Thinking et GPT-5.4 Pro. Cette fois, ce sont clairement les usages professionnels qui sont ici ciblés par cette mise à jour.

OpenAI décrit GPT-5.4 comme son « modèle frontière le plus performant et le plus efficient pour le travail professionnel ».

Un million de tokens et du computer use en série

GPT-5.4 hérite des capacités de codage de GPT-5.3-Codex et y ajoute une couche d’améliorations sur six axes principaux : le suivi d’instructions, la compréhension de documents multimodaux, l’exécution de tâches longues en mode agent, l’efficacité en tokens pour réduire les coûts, la recherche web agentique multi-sources, et les workflows professionnels lourds (tableurs, présentations, documents).

Parallèlement la fenêtre de contexte passe officiellement à un million de tokens en API et dans Codex (mais pas dans ChatGPT qui reste sur 400.000 tokens).

L’autre nouveauté marquante est l’intégration native de capacités de « computer use » au sein de ce modèle généraliste. GPT-5.4 peut piloter un navigateur, interpréter des captures d’écran, émettre des commandes clavier et souris.

Autre nouveauté, en mode Thinking, le modèle affiche désormais un plan de raisonnement initial que l’utilisateur peut corriger en cours de génération, évitant de consommer des milliers de tokens sur une mauvaise piste.

Benchmarks, pricing et ciblage finance

Sur le plan des performances, OpenAI revendique 18 % d’erreurs factuelles en moins et 33 % de fausses affirmations en moins par rapport à GPT-5.2. Sur GDPval, un benchmark interne couvrant 44 métiers, GPT-5.4 égale ou dépasse les professionnels humains dans 83 % des comparaisons (contre 71 % pour GPT-5.2). Côté finance, le score bondit de 43,7 % (GPT-5) à 88 % sur un benchmark interne de modélisation tableur de type analyste junior en banque d’investissement. Sur SWE-Bench Pro (codage), GPT-5.4 devance même GPT-5.3-Codex et Gemini 3.1 Pro.

La tarification API augmente en contrepartie : 2,50 $/15 $ par million de tokens en entrée/sortie pour le mode Thinking (contre 1,75 $/14 $ pour GPT-5.2), et 30 $/180 $ pour la version Pro, le modèle le plus cher jamais proposé par OpenAI. Le fabricant argumente que l’efficacité en tokens (jusqu’à 47 % d’économie sur certaines tâches) compense largement cette hausse tarifaire.

En parallèle, OpenAI lance « OpenAI for Financial Services », une suite d’outils intégrés à ChatGPT pour les institutions financières. Le programme inclut ChatGPT intégré directement dans Excel et Google Sheets (en bêta), des connecteurs vers FactSet, MSCI, Third Bridge et Moody’s, ainsi que des « Skills » réutilisables pour des tâches récurrentes de finance (aperçus de résultats, analyses comparables, DCF, mémos d’investissement).

Bref, OpenAI semble désormais accélérer le rythme de sortie de ses modèles pour recoller à Anthropic et son Claude Opus 4.6 qui fait l’unanimité. Quitte à placer les modèles « Thinking » et « Instant », sur des stratégies et des rythmes d’évolution différents. Ainsi, ChatGPT s’appuie donc désormais sur « GPT-5.3 Instant » et « GPT-5.4 Thinking ». Et on constate rapidement à l’usage que « GPT-5.4 » malgré ses capacités très supérieures n’a malheureusement pas la qualité d’écriture et la tonalité de GPT-5.3 Instant.

Au passage, OpenAI transforme à chaque itération un peu plus son assistant en plateforme d’agents professionnels capables de piloter des applications de bout en bout, pas seulement de répondre à des questions. Le computer use natif, la fenêtre de contexte d’un million de tokens et le ciblage explicite des métiers de la finance et de l’analyse positionnent « GPT-5.4 Thinking » en concurrent direct de Claude Code et Cowork (Anthropic) et de Gemini dans Google Workspace. On est donc très curieux de voir comment non seulement OpenAI mais aussi son partenaire Microsoft vont l’employer pour rendre Microsoft 365 et Windows 11 un peu plus intelligents et utiles.

