xAI, la société d’intelligence artificielle fondée par Elon Musk, vient de lancer Grok 4, la dernière version de son modèle IA et de son assistant Grok intégré à la plateforme X (anciennement Twitter). Cette annonce survient dans un contexte délicat, seulement 24 heures après que la version précédente du modèle ait été désactivée en urgence pour avoir tenu des propos extrémistes.

C’est au travers d’une vidéo diffusée sur son réseau X qu’Elon Musk et les responsables de sa startup xAI ont annoncé aujourd’hui l’arrivée de la troisième itération majeure du modèle « Grok » ou plutôt « des » modèles puisque la dernière création de la jeune pousse aux dents longues et au style atypique se décline en version Grok-4 et Grok-4-Heavy.

Un lancement dans la tourmente

Grok 3 a récemment créé la controverse en adoptant des positions nazies, en s’alignant un peu trop ouvertement sur les idées politiques de l’extrême droite française, en se surnommant lui-même « MechaHitler » et en publiant des contenus antisémites. Des dérives qui font suite à d’autres dérives précédentes comme des descriptions graphiques d’agressions sexuelles violentes. Ces dérapages ont été attribués à une instruction système encourageant le modèle à ne pas éviter les affirmations « politiquement incorrectes » tant qu’elles étaient « bien étayées ». Musk a reconnu que Grok 3 était « trop désireux de plaire et d’être manipulé », promettant que ce problème serait résolu.

Deux versions pour des usages différents

Il est trop tôt pour dire si les deux nouvelles variantes corrigent ces biais et dérivent. Mais les modèles Grok-4 sont des modèles de raisonnement et plusieurs études ont montré ces derniers mois que ces modèles avaient tendance à halluciner plus que les modèles classiques.

Grok 4 et Grok 4 Heavy partagent un même savoir, de mêmes capacités multimodales, un même apprentissage. Mais alors que Grok 4 fonctionne comme un agent unique, Grok 4 Heavy déploie plusieurs agents qui travaillant en équipe pour résoudre des problèmes d’une grande complexité. Cette approche multi-agents permet aux différents modules de comparer leurs résultats avant de fournir une réponse finale. Les deux versions sont disponibles immédiatement via l’API de xAI, mais aussi sur l’assistant Grok AI. À condition de payer ! Grok-4 nécessite l’abonnement traditionnel « SuperGrok ». L’accès au modèle Heavy nécessite en revanche un tout nouvel abonnement pour compenser sa consommation excessive de ressources : l’abonnement « SuperGrok Heavy » est facturé 300 dollars par mois. Une approche alignée avec celle de Google et son forfait Ultra, celle d’OpenAI et son abonnement ChatGPT Pro, ou encore Anthropic et son abonnement Claude MAX. Les pionniers de l’IA facturent désormais les fonctionnalités les plus avancées au prix fort.

L’entraînement du modèle Grok-4 a mobilisé l’intégralité des 200 000 GPU du superordinateur Colossus de xAI, avec une puissance de calcul multipliée par 100 par rapport à celui de Grok 2 l’an dernier.

Des performances revendiquées exceptionnelles

Selon xAI, Grok 4 établit de nouveaux standards sur plusieurs benchmarks clés. Sur l’évaluation ARC-AGI-2 mesurant le raisonnement avancé, le modèle atteint 15,9% de précision, doublant les performances du deuxième meilleur modèle, Claude Opus 4. Il devient également le premier à franchir la barre des 10% sur ce nouveau test.
Sur le plus ancien benchmark Humanity’s Last Exam, composé de 2500 questions expertes multidisciplinaires, Grok 4 résout un quart des problèmes sans outils, tandis que Grok 4 Heavy dépasse les 50% sur le sous-ensemble textuel.
De son côté, l’analyste Artificial Analysis attribue à Grok 4 un score d’intelligence de 73, le plaçant devant OpenAI o3 (70), Google Gemini 2.5 Pro (70), Anthropic Claude 4 Opus (64) et DeepSeek R1 (68).

Une interface vocale repensée

Grok AI évolue et bénéficie désormais d’un mode vocal amélioré avec cinq options différentes, dont « Sal » à la voix grave évoquant un narrateur de bande-annonce, et « Eve » dotée d’un accent britannique sophistiqué. Durant la démonstration, Eve a tenté une performance opératique sur le thème du Coca Light, avec des résultats mitigés. xAI revendique une latence réduite et une multiplication par dix du nombre d’utilisateurs actifs en huit semaines pour cette fonctionnalité vocale.

Entre promesses ambitieuses et silence sur les controverses

Musk n’a pas hésité à formuler quelques prédictions audacieuses comme il les affectionne, affirmant – à qui veut bien l’entendre – que Grok 4 pourrait « découvrir de nouvelles technologies d’ici la fin de l’année » et même « découvrir une nouvelle physique l’année prochaine ». Des déclarations à l’emporte-pièce, accueillies par un silence gêné de son équipe et qui s’inscrivent dans la pure tendance du milliardaire à surenchérir sur les capacités de tous ses produits.

L’avenir nous dira si Grok 4 tient à l’usage réel ses promesses et s’il parviendra à éviter les écueils de son prédécesseur. Pour l’heure, la communauté technologique observe avec attention cette nouvelle itération, entre scepticisme face aux déclarations grandioses et curiosité pour les réelles avancées techniques revendiquées. Et Elon Musk reconnaît lui-même être étonné par les progrès réalisés : « D’une certaine manière, c’est un peu terrifiant, mais la croissance de l’intelligence ici est remarquable, » avant d’ajouter « c’est quelque peu déconcertant d’avoir créé une intelligence un peu plus grande que la nôtre ».

 

À lire également :