Anthropic a mis en ligne hier soir son nouveau modèle frontière Claude Opus 4.7, une itération qui lui permet de reprendre la tête du peloton sur les Benchmarks face à GPT-5.4 et Gemini 3.1 Pro. Mais l’éditeur concède sans détour que son vrai cheval de bataille, le déjà fameux Mythos Preview, lui est bien supérieur et reste confiné au laboratoire pour d’évidentes raisons de cybersécurité.

Deux mois, jour pour jour, après Opus 4.6, Anthropic tient son rythme de croisière et dévoile la version 4.7 de son LLM frontière. Disponible immédiatement sur l’ensemble des produits Claude, via l’API maison, ainsi que sur Amazon Bedrock, Google Cloud Vertex AI et Microsoft Foundry, le modèle conserve la grille tarifaire de son prédécesseur : 5 dollars par million de tokens en entrée, 25 dollars en sortie.

Derrière l’incrément cosmétique du numéro de version se cache pourtant un modèle qui, selon les propres graphiques d’Anthropic, prend la tête sur presque tous les benchmarks clés devant GPT-5.4 d’OpenAI et Gemini 3.1 Pro de Google. Même si les gains sont parfois minimes, Opus 4.7 se révèle à l’usage pour l’utilisateur de Claude AI toujours aussi pertinent mais plus rapide. Pour les entreprises, il se montre plus agile et stable sur les tâches agentiques mais éventuellement plus onéreux en raison d’un nouveau tokenizer plus consommateur mais qui invite le modèle à mieux réflechir.

Reste que cette sortie devrait rassurer une base d’utilisateurs qui, ces dernières semaines, s’interrogeait bruyamment (comprenez sur les réseaux sociaux) sur une supposée dégradation d’Opus 4.6 afin de limiter sa consommation de ressources de calcul.

Codage long cours, vision dopée et autocritique

Comme toujours, la lecture du communiqué donne furieusement l’impression que le cœur de cible de ces modèles reste le développeur. Anthropic affirme qu’Opus 4.7 encaisse désormais les tâches d’ingénierie logicielle les plus coriaces sans supervision rapprochée, avec une rigueur et une capacité de vérification de ses propres sorties jusqu’ici inédites. La société cite les retours de  plusieurs « early adapters » comme la société Hex : sur un benchmark interne de 93 tâches de codage, Opus 4.7 améliore le taux de résolution de 13 % par rapport à Opus 4.6, et résout quatre tâches que ni Opus 4.6 ni Sonnet 4.6 ne parvenaient à boucler.

Plus intéressant, le niveau « low-effort » d’Opus 4.7 équivaudrait grosso modo au « medium-effort » d’Opus 4.6. Une efficacité accrue que les développeurs pourront moduler finement grâce à un nouveau palier de raisonnement baptisé xhigh (« extra high »), intercalé entre « high » et « max ». Anthropic recommande d’ailleurs de démarrer directement en xhigh pour les cas d’usage agentiques.

Un système expérimental de « task budgets » vient par ailleurs donner aux développeurs un contrôle plus fin sur le raisonnement du modèle lors des tâches longues. C’est d’autant plus important que le paramètre « Thinking » n’accepte désormais qu’un seul mode « Adaptive ». Ce dernier ce traduit sur l’assistant Claude par la disparition du mode de réflexion étendue au profit d’une paramètre « Pensée Adaptative« , qui, lorsqu’il est activé, laisse le modèle décidé de lui-même de l’intensité et de la durée de son raisonnement. Conséquence immédiate, sur Claude AI, Claude Opus 4.7 répond bien plus rapidement que Claude Opus 4.6 sur la majorité des prompts:!

Côté vision, Opus 4.7 avale désormais des images trois fois plus larges que précédemment. De quoi ouvrir la voie à des cas d’usage multimodaux exigeants comme la lecture de captures d’écran denses ou l’analyse de documents financiers scannés. Le modèle revendique également un meilleur goût esthétique pour produire interfaces, présentations et documents professionnels.
On notera au passage que contrairement à ChatGPT et à Gemini, Claude AI ne sait toujours pas générer d’illustrations.

Mémoire persistante et analyste financier

Autre évolution notable : la mémoire. Opus 4.7 exploite plus efficacement une « mémoire fichier », ce qui lui permet de conserver et de référencer des notes d’une tâche à l’autre, sans que l’utilisateur ait à ré-injecter le contexte à chaque session. Anthropic revendique par ailleurs une position d’état de l’art sur GDPval-AA, benchmark tiers qui évalue les LLM sur des tâches économiquement utiles en finance et en droit.

Attention tout de même, deux changements risquent de peser sur la facture. D’abord, Opus 4.7 embarque un tokenizer mis à jour qui peut faire grimper la consommation de tokens d’un facteur 1,0 à 1,35 selon la nature du contenu.
Ensuite, le modèle réfléchit davantage aux niveaux d’effort élevés, produisant mécaniquement plus de tokens en sortie. Anthropic invite à jouer sur le paramètre d’effort ou à demander explicitement des réponses plus concises pour limiter la casse.

L’éléphant Mythos dans la pièce

Impossible d’évoquer Opus 4.7 sans parler de Claude Mythos Preview, le modèle ultra-confidentiel qu’Anthropic a déployé début avril auprès d’un cercle fermé de partenaires dans le cadre du projet Glasswing. Mythos est incontestablement plus capable qu’Opus 4.7, notamment sur le volet cybersécurité offensive, et l’éditeur le concède publiquement. Ses capacités cyber avancées, potentiellement détournables pour identifier des vulnérabilités logicielles, justifient selon Anthropic son cantonnement à une diffusion contrôlée.

Et dans ce contexte, Opus 4.7 sert en réalité de banc d’essai réglementaire. Anthropic explique publier Opus 4.7 avec des nouveaux garde-fous qui détectent et bloquent automatiquement les requêtes indiquant des usages cybersécurité interdits ou à haut risque, et que les enseignements tirés du déploiement réel de ces protections aideront à préparer une éventuelle diffusion plus large des modèles de classe Mythos.

Pour ne pas pénaliser les professionnels légitimes (pentesteurs, red-teamers, chercheurs en vulnérabilités), Anthropic ouvre parallèlement un Cyber Verification Program qui donnera accès à Opus 4.7 sur dossier avec contrôle avancé des identités des utilisateurs. Ils auront alors accès à une version de Claude Opus 4.7 qui ne bloque pas les usages cyber avancés.

Un positionnement assumé : l’entreprise d’abord

Avec Opus 4.7, Anthropic ne joue pas la carte de la révolution, mais celle du rouleau compresseur. Pas d’annonce tonitruante ni de rupture architecturale : juste la volonté méthodique de verrouiller le terrain qui gonfle ses revenus mois après mois, à savoir le développement logiciel agentique et la productivité en entreprise. La sortie simultanée des nouveautés Claude Code — dont la commande /ultrareview et l’extension de l’auto mode aux abonnés Max — achève de composer le tableau.

Quant à la stratégie « double voie » chère à la maison (itérations commerciales rapides sur Opus en vitrine, modèle frontière Mythos soigneusement cadenassé à l’arrière-boutique), elle dessine un nouveau paysage de l’IA à double vitesse auquel les DSI vont devoir s’habituer.

Reste à voir si les clients entreprises tiendront compte de la facture token potentiellement alourdie, et si les concurrents laisseront Anthropic pavoiser longtemps. Après tout, OpenAI et Google ne sont jamais bien loin.

____________________________

À lire également :

Claude d’Anthropic séduit massivement les entreprises

Claude IA s’installe peu à peu au cœur de Microsoft 365

Claude Code, Cowork, panique boursière : la semaine agitée d’Anthropic

Claude Sonnet 4.6 : le modèle intermédiaire qui joue dans la cour des grands

Anthropic fait entrer les apps dans Claude et change la façon de travailler