Depuis quelques heures, ChatGPT a la bosse des maths. Il est devenu beaucoup plus fort en maths, physique, et programmation grâce à une nouvelle génération de modèles « o1 Series » capables de réfléchir avant de répondre !
Dans le petit monde de l’IA tout le monde attend avec impatience la prochaine génération de modèles « GPT » d’OpenAI à savoir le très attendu mais non encore annoncé « GPT-5 ».
Mais tout en poursuivant son travail sur ses modèles GPT, OpenAI travaille depuis plusieurs mois sur une nouvelle génération de modèles connus sous le nom de code « Strawberry » et dérivant du projet de recherche « Q* ».
Hier soir, OpenAI a pris tout le monde de surprise en annonçant la première concrétisation de ses efforts et la disponibilité immédiate de deux nouveaux modèles LLMs dénommés « O1-Preview » et « O1-mini ». Ils sont les deux premières déclinaisons d’une nouvelle génération de modèles estampillés « OpenAI o1 Series ».
« Ces modèles représentent une avancée si significative que nous réinitialisons notre compteur et repartons ainsi à 1 » explique OpenAI.
Avant d’ajouter : « OpenAI o1 marque une nouvelle génération de modèles entraînés pour passer plus de temps à réfléchir aux problèmes qu’on leur soumet, avant de commencer à répondre. Ce nouvel entraînement leur permet d’affiner leur processus de réflexion, d’essayer différentes stratégies et même de reconnaître qu’ils font fausse route avant de formuler leur réponse ».
Là où les précédents modèles « GPT » cherchaient à mimer les réflexions humaines à partir des contenus qui servaient à leur apprentissage, les modèles « OpenAI o1 » essayent de raisonner par eux-mêmes et de trouver leurs propres solutions en découpant les problèmes soumis en plusieurs étapes à résoudre pas à pas et en évaluant au fur et à mesure la pertinence des chemins de raisonnement empruntés. C’est seulement après cette première phase qu’ils commencent alors à formuler une réponse en langage naturel.
Quelles sont les qualités des modèles « o1 » ?
– les modèles « o1 » sont plus performants en mathématiques, en physique et en programmation que les modèles GPT. Ils obtiennent « 83/100 » aux tests d’admission aux Olympiades de Mathématiques là où GPT-4o n’obtient qu’un triste « 13/100 ».
– les modèles « o1 » sont capables de résoudre des problèmes plus complexes et de suivre des instructions avec plus d’attention et de discipline.
– les modèles « o1 » sont significativement de meilleurs développeurs que les modèles « GPT ».
– les modèles « o1 » ont un niveau intellectuel d’un doctorant, là où GPT-4 a plutôt celui d’un collégien.
– les modèles « o1 » sont notablement plus sûrs et sont plus difficiles à duper car ils exploitent leurs propres capacités de raisonnement pour s’assurer d’adhérer aux directives de sécurité.
Quelles sont les limites des modèles « o1 » actuels ?
– les modèles « o1 » sont limités à des prompts textuels.
– les modèles « o1 » ne peuvent pas encore analyser des fichiers téléchargés ou des images.
– les modèles « o1 » sont plus lents à répondre que les modèles « GPT » parce qu’ils ont besoin de plusieurs secondes de réflexion avant de formuler une réponse.
– les modèles « o1 » sont encore très expérimentaux et bridés par OpenAI qui n’autorise que 30 messages par semaine (50 pour la version mini) avec ces IA sur ChatGPT Plus.
Pour l’instant deux modèles sont disponibles : « o1-preview » et « o1-mini » :
* « O1-preview » préfigure la prochaine génération de modèles frontières aux capacités de réflexion étendues.
* « O1-mini » est un modèle dédié aux problèmes scientifiques, mathématiques et de programmation. Il est bien plus rapide que « o1-preview » et surtout 80% moins onéreux quand on appelle l’API d’OpenAI. Mais ses connaissances et compétences se limitent à l’univers des STEM (Science, Technologie, Ingénierie et Mathématiques).
« o1-preview » et « o1-mini » constituent les deux premières déclinaisons de la nouvelle génération de modèles « o1 Series » d’OpenAI. Ils sont dès à présent accessibles via ChatGPT Plus et ChatGPT Team ainsi que via les API de la plateforme OpenAI et de la plateforme Azure AI de Microsoft.
Ils ne sont pas destinés à remplacer les modèles GPT pour l’instant, GPT-4o restant le modèle de prédilection pour travailler avec l’IA ChatGPT au quotidien. D’ailleurs, OpenAI a confirmé continuer de faire progresser ses modèles « GPT » parallèlement à ses nouveaux modèles « o1 », même si l’éditeur n’a pour l’instant laissé entrevoir aucune date de sortie pour GPT-5 (on devrait avoir prochainement une nouvelle version de GPT-4o).