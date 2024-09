Dur, dur, de survivre dans ce monde des gros bras de l’IA face aux milliards injectés par l’économie américaine dans ses startups, la puissance d’innovation d’OpenAI et le dynamisme d’Anthropic ou Meta. Même quand on s’appelle Mistral AI et que l’on est présenté comme l’alternative européenne.

Avec des moyens infiniment moindres mais des compétences reconnues et un savoir-faire économe en ressources, Mistral AI semble être la seule startup européenne encore en mesure de se battre sur le front des modèles frontières avec notamment son modèle Claude Large 2.

Mais il ne s’agit pas que de se battre sur ce front. L’important est aussi de séduire les entreprises avec des solutions pratiques à mettre en place, simples et peu onéreuses. Et là aussi, il faut savoir innover pour s’imposer.

Un dynamisme nécessaire

On ne peut pas reprocher à Mistral de manquer de dynamisme, ni d’efficacité dans la concrétisation de ses objectifs. Depuis le début de l’année, Mistral a lancé non seulement son service conversationnel « Le Chat » et des services de « Fine Tuning » très accessibles, mais surtout pas moins de 7 modèles : Mistral Small, Mistral Large, Mistral Large 2, Codestral 22B, Codestral Mamba, Mistral NeMo et Mathstral (concurrent avant l’heure d’OpenAI o1-mini).

Et ce n’est pas fini. La jeune pousse a dévoilé cette semaine deux nouveaux modèles : une évolution de Small et surtout son premier modèle multimodal.

Mistral Small v24.09 est une nouvelle version du petit modèle commercial de Mistral AI conçu pour les besoins d’entreprise en quête d’IA à l’échelle et de grande réactivité sans sacrifier à la fiabilité des réponses. Ce nouveau « Small » est conçu pour des tâches variées comme la traduction de messages et textes mais aussi l’analyse de sentiments, tout en offrant une meilleure efficacité et un coût réduit.

Enfin un modèle multimodal

Mistral Pixtral 12B est le premier modèle multimodal de Mistral AI. Publié en open source (sous licence Apache 2.0), il démontre une nouvelle fois que les petits modèles peuvent se montrer extrêmement performants dans la compréhension d’images, ce que GPT-4o mini, LLama 3.1 8B, Phi-3.5-vision, Gemini Flash ou Claude Haiku avaient déjà révélé. Selon Mistral, Pixtal 12B « est le premier modèle multimodal open source à supporter des images de n’importe quelle taille sans dégradation des performances textuelles ».

S’inspirant des innovations introduites avec Mistral NeMo, Pixtral comprend à la fois les documents et les images. Il surpasse Claude 3 Haiku, Gemini Flash 1.5 et LLava OneVision sur la plupart des benchmarks les plus populaires.

Selon Mistral AI, « Pixtral est conçu pour optimiser à la fois la vitesse et les performances. Nous avons entraîné un nouvel encodeur visuel qui prend en charge nativement des images de tailles variables. Pixtral peut être utilisé pour comprendre avec précision des diagrammes complexes, des graphiques et des documents en haute résolution, tout en offrant des vitesses d’inférence rapides sur de petites images telles que des icônes, des cliparts et des équations ». Il est aussi capable de transposer un croquis rapide à main levée en une page Web codée en HTML.

Pixtral est bien évidemment disponible via des API sur « La Plateforme » de Mistral AI afin de doper les applications de capacités IA multimodales mais également sur l’interface conversationnelle « Le Chat » pour scanner, analyser, rechercher, commenter et comprendre les fichiers aussi bien personnels que d’entreprises.

Séduire toujours plus d’entreprises et de développeurs

Outre ces annonces, la jeune pousse française fait le forcing pour séduire toujours plus développeurs et leur permettre d’intégrer à moindre coût des capacités IA avancées au cœur de leurs applications.

Ainsi, Mistral AI annonce l’arrivée d’un plan gratuit « Free Tier » sur sa plateforme serverless « La Plateforme ». Il permet aux développeurs de tester et d’expérimenter gratuitement les modèles de Mistral afin d’en évaluer le potentiel et les mettre en œuvre sans frais de développement et de debugging.

Parallèlement, la startup annonce réviser tous ses tarifs à la baisse afin que ses modèles restent compétitifs après les baisses de prix annoncés par OpenAI et Google.

– Mistral NeMo est désormais facturé 0,15 $ par million de tokens en entrée comme en sortie.

– Mistral Large 2 devient le LLM frontière le plus accessible (2$ par million de tokens en entrée, 6$ en sortie).

– Quant au nouveau Pixtral 12B, il affiche un tarif très séduisant avec ses 0,15$ par million de tokens (en entrée comme en sortie).

À lire également :