Anthropic dévoile son nouveau modèle d’IA « léger », Claude Haiku 4.5, qu’il présente comme aussi performant que Sonnet 4 en codage, tout en étant plus rapide et nettement moins cher. Ce lancement marque une étape pour rendre les technologies de génération de texte plus accessibles à grande échelle et en fait un modèle de prédilection dans un monde où les agents IA se multiplient comme des petits pains.

On n’avait pas vu le plus compact des modèles Claude depuis un bon moment. Depuis octobre 2024 et la sortie de la version 3.5 de Claude Haïku. Resté discret depuis, éclipsé par les versions plus puissantes comme Sonnet 4.5 et Opus 4.1, Claude Haïku fait son grand retour sur la scène international avec une version 4.5 ultra compacte qui bouscule les attentes en matière de performance, de vitesse et de coût !

Ces derniers temps, Anthropic avait beaucoup focalisé son attention sur ses grands modèles onéreux mais considérés comme les meilleurs modèles d’aide au codage du marché et très appréciés notamment par les entreprises. Au point que les modèles Claude tiendraient plus de 40% du marché en entreprise loin devant ceux d’OpenAI (dans les 25%).

Un modèle léger mais hybride avec raisonnement intégré

Présenté comme offrant des performances proches de Sonnet 4 pour un tiers du prix et plus du double de la vitesse, Haïku 4.5 marque un tournant dans la stratégie d’Anthropic. « Ce qui était à la frontière il y a quelques mois est désormais plus rapide et plus abordable », résume l’équipe technique dans son annonce officielle. Le modèle se distingue notamment dans les tâches liées à l’utilisation d’ordinateurs, où il surpasse même Sonnet 4.

Conçu pour les environnements où la latence est critique — assistants conversationnels, agents de service client, codage en binôme — Haïku 4.5 combine une intelligence élevée avec une réactivité impressionnante. « Il atteint un équilibre qu’on pensait impossible : une qualité de codage quasi-frontière avec une rapidité fulgurante et une efficacité économique », s’enthousiasme Guy Gur-Ari, cofondateur de la startup Augment AI.

Cette version s’intègre parfaitement dans des architectures multi-agents, où Sonnet peut orchestrer des plans complexes pendant que plusieurs Haïku exécutent les tâches en parallèle. Mike Krieger, directeur produit chez Anthropic, y voit une révolution dans les déploiements en production : « Cela ouvre de toutes nouvelles catégories d’usages pour l’IA en environnement réel ». D’autant que selon Anthropic, le modèle est capable de fonctionner de manière autonome pendant des durées prolongées (plus de 30 heures).

Les développeurs, notamment ceux qui utilisent Claude Code, devraient apprécier cette montée en puissance. Andrew Filev, PDG de Zencoder, estime que « ce niveau de performance, il y a six mois, aurait été considéré comme à la pointe de la technologie. Aujourd’hui, il fonctionne jusqu’à cinq fois plus vite que Sonnet 4.5 pour une fraction du coût ». Anthropic souligne que sur le benchmark SWE-bench Verified, Haiku 4.5 obtient un score de 73,3 %, ce qui le place au-dessus de Sonnet 4 sorti en mai dernier. Rappelons que depuis, Anthropic a sorti Sonnet 4.5 début octobre.

Le moins onéreux des modèles d’Anthropic

Au niveau tarifaire, Haiku 4.5 est proposé à 1 $ par million de tokens d’entrée et 5 $ par million de tokens de sortie, ce qui le rend légèrement plus cher que Haiku 3.5 (0,80 $/4 $) mais beaucoup plus abordable que Sonnet 4 ou Sonnet 4.5 (3 $/15 $). Reste que la concurrence est significativement moins onéreuse : Gemini 2.5 Flash est facturé 0,30 $ par million de tokens en entrée et 2,5 $ en sortie ; GPT-5 mini est tarifé 0,25$ en entrée et 2$ en sortie par million de tokens.

Avec Haiku 4.5, Anthropic cherche à densifier sa gamme : proposer un modèle de moindre coût mais performant pour remplir le « bas de l’entonnoir » des usages IA. Les entreprises sensibles au coût, notamment pour des grands volumes de requêtes, peuvent potentiellement intégrer davantage de services IA internes sans payer pour les modèles les plus puissants.

Côté sécurité, Haïku 4.5 se montre également exemplaire. Il affiche un taux de « comportements problématiques » inférieur à ses prédécesseurs et même à Sonnet 4.5 et Opus 4.1. Il est ainsi classé au niveau de sécurité ASL-2, moins restrictif que les modèles plus puissants, ce qui facilite son intégration dans des produits accessibles au grand public ou dans des scénarios critiques.

Comme le résume Brad Axen, tech lead IA : « La vitesse est le nouveau territoire à conquérir pour les agents IA. Haïku 4.5 prouve qu’on peut allier intelligence et rapidité ». Ce qui en fait un concurrent très sérieux aux modèles de Mistral AI réputés justement pour leur célérité.

À lire également :

Anthropic dévoile Claude Sonnet 4.5, son « collègue numérique » plus intelligent

Claude Opus 4.1 : Anthropic élève le niveau

Claude for Chrome : Anthropic teste l’IA agentique dans le navigateur

OpenAI dévoile Sora 2 : l’IA vidéo qui défie TikTok et les réseaux sociaux

Google lance Gemini 2.5 Flash, un modèle qui raisonne à faible coût…

Google Gemini 2.5 Flash Image : un nouveau modèle doué pour la retouche

OpenAI dévoile GPT-5-Codex, un modèle conçu pour l’ingénierie logicielle agentique

Ça y est… GPT-5 est là !