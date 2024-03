Ça bouge fort dans l’univers des grands LLM. Et la concurrence pour ChatGPT se fait plus intense. Après, Gemini Ultra de Google, Mistral Large de Mistral AI, c’est au tour d’Anthropic de lancer son LLM « meilleur que GPT-4 »… Décryptage…

Anthropic est sans doute la startup américaine de l’IA la plus connue après OpenAI. Elle s’est particulièrement fait remarquer l’an dernier en introduisant ses LLM « Claude » puis « Claude 2 » salués pour leur compréhension des instructions, la qualité de leur rédaction et la rapidité de leur réponse.

Au point qu’Anthropic a su attirer l’attention des financiers. Depuis sa naissance en 2021, elle a levé plus de 7 milliards de dollars et a notamment bénéficié l’an dernier du soutien d’AWS qui a mis 4 milliards de dollars sur la table pour en devenir le principal partenaire commercial.

Hier, la jeune pousse américaine (fondée par des anciens d’OpenAI) a lancé trois nouveaux modèles estampillés « Claude 3 » :

– Claude 3 Haiku est le modèle le plus rapide et le plus économique (0,25$ par million de tokens reçus et 1,25$ par million de tokens générés)

– Claude 3 Sonnet est le modèle milieu de gamme qui anime l’interface gratuite « Claude.ai » (3$ par million de tokens reçus et 15$ par million de tokens générés)

– Claude 3 Opus est le nouveau fleuron de la famille, un modèle multimodal, qui anime notamment la version payante du chatbot conversationnel « Claude.ai » mais qui est aussi le modèle le plus onéreux (15$ en entrée, 75$ en sortie par million de tokens).

Chacun de ses modèles bénéficie par défaut d’une fenêtre contextuelle de 200.000 tokens, mais une version expérimentale (sous conditions commerciales spécifiques) de Claude 3 Opus permet de disposer d’une fenêtre d’un million de tokens. Difficile de traduire des tokens en mots mais Claude 3 permettrait selon certains spécialistes d’analyser et résumer des documents de 200.000 mots environ soit le double des capacités de Claude 2.

Selon la société, son modèle haut de gamme Claude 3 Opus surpasse les offres d’OpenAI et de Google, telles que GPT-4 et Gemini 1.0 Ultra, dans de nombreux tests de référence couvrant des domaines allant des connaissances universitaires aux mathématiques de niveau primaire, en passant par les connaissances générales. Même si Mistral Large n’est pas utilisé dans les comparaisons, il apparaît lui aussi légèrement inférieur à Claude 3 Opus (les mêmes tests ayant été utilisés par Mistral AI pour se comparer à GPT-4 et Gemini Pro).

Pour les Français, il n’est pas si aisé de tester Claude 3 Opus, uniquement disponible sur la version payante de l’agent conversationnel « Claude.ai », puisque l’accès via cette interface à ces modèles est interdit aux européens de l’UE.

Les modèles Opus et Sonnet sont disponibles dès aujourd’hui soit depuis les API d’Anthropic, soit depuis AWS et son API Bedrock. AWS s’est d’ailleurs empressé d’annoncer cette disponibilité et de s’afficher comme partenaire commercial principal d’Anthropic, saisissant ainsi au passage l’opportunité de se montrer à son avantage et de se remettre dans la course à l’IA générative.

D’un autre côté, il y avait urgence à réagir et à rebondir sur l’opportunité média de se mettre en avant. Car Google est également sur les rangs. Les nouveaux modèles d’Anthropic sont en effet également disponibles sur Google Cloud via le service Vertex AI mais cette disponibilité est pour l’instant restreinte et limitée aux partenaires de confiance.

Dans son communiqué de presse, Anthropic affirme que Claude 3 Opus offre non seulement de meilleures réponses textuelles que GPT-4 et Gemini Pro, mais dispose également de fonctionnalités multimodales « au niveau des leaders » (GPT-4V et Gemini Ultra) afin de permettre aux utilisateurs de télécharger des images, des documents, des graphiques et d’autres contenus, et d’obtenir des réponses pertinentes.

On espère désormais que « Claude.Ai » ouvrira rapidement un accès aux Européens. En trichant à l’aide d’un VPN, les premiers tests que nous avons réalisés en français sur Claude 3 Sonnet nous ont paru très pertinents et prometteurs.

Une dernière réflexion pour conclure : la lutte s’intensifie et les retards de la concurrence sur OpenAI sont désormais résorbés, en matière de LLM tout au moins. Google peut s’inquiéter. Malgré les milliards investis, ses « Gemini Pro » et « Gemini Ultra » sont loin de convaincre et se prennent des vestes faces aux petits poucets Anthropic Claude 3 et Mistral Large. Et l’argument des coûts moindres de Gemini reste aujourd’hui son principal atout. Quant à OpenAI, il commence à y avoir urgence à proposer significativement mieux que GPT-4 Turbo, même si – à l’usage pour le commun des mortels – son « ChatGPT Plus/Teams/Enterprise » est autrement plus avancé que ses concurrents directs (Gemini, Claude AI, Le Chat). Reste à voir si GPT-5 marquera une amélioration aussi importante que ce que Claude 3 est à Claude 2 ou Mistral à Mixtral 8x7B.

Une chose est sûre, ces IA génératives n’ont pas fini de nous étonner.

