Entraînée notamment avec les Tweets des internautes mais également bien d’autres sources de données, Grok-2 se révèle être un LLM multimodal de dernière génération, à même de concurrencer GPT-4o, mais doté d’un humour sarcastique marqué et de filtres réduits au strict minimum lui laissant de grandes marges de manœuvre pour sortir des rails…
Soyons francs, la première IA conversationnelle sortie en 2023 des labos de xAI, la dernière startup en date d’Elon Musk, n’avait pas convaincu grand monde. La jeune pousse a annoncé la semaine dernière la disponibilité sur X (ex-Twitter) de ses nouveaux modèles Grok-2 et Grok-2 mini.
Présenté comme un « modèle frontière », autrement dit un très grand LLM, Grok-2 progresse notablement à la fois dans ses capacités conversationnelles mais aussi dans ses capacités de raisonnement et de codage.
Selon xAI, les performances de Grok-2 seraient très proches de Gemini 1.5 Pro, Claude 3.5 Sonnet et GPT-4o. La nouvelle IA les surpasserait même sur certains Benchmarks populaires notamment sur ceux nécessitant des raisonnements mathématiques.
Par ailleurs, Grok-2 est désormais multimodal : il peut analyser des images mais également en générer à partir d’un prompt textuel.
Grok-2 mini est une version plus compacte et plus rapide (très rapide même selon nos tests) de Grok-2 qui offre des performances très légèrement en retrait dans ses capacités d’analyse et de discussion. Bien que plus compacte, l’IA n’en demeure pas moins multimodale avec des capacités d’analyse et de génération d’images.
Une IA libérée ou dérapante ?
Cependant, l’un des éléments qui différencient le plus Grok-2 de ses congénères, c’est la relative absence de filtres. On peut aisément lui faire dire n’importe quoi et lui faire générer n’importe quoi. Sachant qu’elle a été notamment entraînée avec l’ensemble des tweets publiés par la planète entière, le « n’importe quoi » peut réellement partir en « vraiment n’importe quoi » dans la pure philosophie « free speech » revendiquée par Elon Musk. Résultat, depuis trois jours, les images Deepfakes se multiplient sur X et sur la toile, l’IA ne refusant pas de créer des faux à partir de portraits de stars et d’hommes/femmes politiques.
Et, forcément, les critiques fusent. Un professeur de l’Harvard Law Cyberlaw Clinic, Alejandra Caraballo, estime ainsi qu’il s’agit là « de l’une des implémentations de l’IA les plus irresponsables et imprudentes jamais vues ».
Néanmoins, Grok-2 n’est pas sans aucun filtre. Les activités violentes sont généralement stoppées et la génération d’images bloque les prompts pornographiques (même s’il est possible de produire un fake d’à peu près n’importe qui en sous-vêtements). Toutefois, selon certains experts, il est assez facile d’usurper Grok pour contourner ses filtrages déjà peu actifs en prétextant une recherche sur un sujet médical ou scientifique.
Il est fort probable que la Commission Européenne – qui a déjà X dans le collimateur pour désinformation et non-respect des règles de modération des contenus illégaux – ne se montre gère enthousiaste et amusée par les frasques de Grok-2, une IA considérée par Elon Musk comme « la plus fun de toutes les IA ».
XAI annonce que les API permettant d’accéder à Grok-2 sur des clusters hébergés dans le cloud seront prochainement disponibles avec des systèmes d’authentification MFA pour les entreprises. Reste à voir si elles seront nombreuses à adhérer aux concepts « free speech » d’Elon Musk et oseront employer dans un cadre professionnel un modèle aux filtres aussi permissifs.