Après OpenAI, Google Deepmind confirme qu’une version expérimentale de Gemini Deep Think a, elle aussi, réussi à obtenir une médaille d’or aux Olympiades de mathématiques 2025.
Hier soir, OpenAI annonçait qu’un nouveau modèle IA de type « OpenAI o » expérimental avait réussi à obtenir la médaille d’or aux Olympiades internationales de Mathématiques (IMO).
Quelques heures plus tard, Google Deepmind annonce également avoir remporté la médaille d’or grâce, là aussi, à un modèle expérimental exploitant une nouvelle version de son « Gemini Deep Think ».
L’Olympiade Internationale de Mathématiques, considérée comme le graal des compétitions mathématiques pour les jeunes talents universitaires depuis 1959, met à l’épreuve les participants sur six problèmes particulièrement ardus.
Tout comme le modèle encore expérimental d’OpenAI, la nouvelle version de Gemini Deep Think a résolu cinq de ces six problèmes, totalisant 35 points sur 42 possibles, un score permettant d’obtenir la médaille d’or, habituellement décernée à seulement 8% des participants humains.
« Nous pouvons confirmer que Google DeepMind a atteint ce jalon tant désiré, obtenant 35 points sur 42 possibles, un score de médaille d’or. Leurs solutions étaient étonnantes à bien des égards. Les correcteurs d’IMO les ont trouvées claires, précises et pour la plupart faciles à suivre », affirme le Professeur Dr. Gregor Dolinar, président de ses Olympiades de Mathématiques 2025.
Une technologie bientôt disponible
La véritable révolution réside dans l’approche adoptée. Contrairement à l’année précédente où AlphaGeometry et AlphaProof nécessitaient une traduction préalable des problèmes en langages formels comme Lean et plusieurs jours de calcul, Gemini Deep Think travaille directement à partir des énoncés en langage naturel. Le système produit des démonstrations mathématiques rigoureuses en respectant la contrainte temporelle de 4h30 imposée aux candidats humains.
Comme pour OpenAI, c’est une nouvelle fois un modèle IA généraliste et non purement mathématique qui obtient ce score remarquable. Cette performance s’appuie sur des techniques de « parallel thinking » permettant au modèle d’explorer simultanément plusieurs pistes de résolution avant de converger vers une solution optimale. L’entraînement du système a intégré des techniques d’apprentissage par renforcement spécifiquement conçues pour le raisonnement multi-étapes et la résolution de théorèmes. La capacité de ces systèmes à opérer en langage naturel, sans nécessiter de traduction en langages formels spécialisés, devrait d’ailleurs simplifier considérablement leur intégration dans les environnements professionnels. Google poursuit néanmoins en parallèle ses efforts sur AlphaGeometry et AlphaProof, qui misent sur des preuves formelles, laissant entrevoir une future hybridation des approches naturelles et formelles du raisonnement.
Google DeepMind prévoit de mettre cette nouvelle version encore expérimentale de Deep Think à disposition d’un groupe restreint de testeurs, notamment des mathématiciens, très prochainement. Avant de l’intégrer à l’offre Google AI Ultra dans les prochains mois. Cette stratégie de déploiement progressif permettra d’affiner le système tout en explorant ses applications potentielles dans des contextes professionnels.
Si Gemini Deep Think démontre que l’IA peut désormais rivaliser avec l’élite humaine sur des problèmes ouverts, l’enjeu reste de comprendre comment ces outils pourront s’intégrer dans la recherche, l’enseignement et le développement de théories inédites.
Le modèle encore expérimental d’OpenAI et le futur nouveau mode « Deep Think » de Google Gemini préfigurent néanmoins l’émergence d’outils capables de traiter des problématiques complexes nécessitant un raisonnement multi-étape, que ce soit pour l’optimisation de processus, la modélisation financière ou la résolution de défis d’ingénierie. Et les chercheurs en IA voient déjà ces IA capables de découvertes scientifiques majeures dans les 18 mois à venir…
À lire également :
OpenAI obtient la médaille d’or aux Olympiades de mathématiques
Grok-4 et Heavy : xAI accélère, OpenAI sous pression
OpenAI donne des nouvelles de GPT-5 !
Les modèles LLM agentiques actuels sont-ils déjà trop intelligents pour nous obéir aveuglément ?
IA : Les modèles à raisonnement vont aussi rapidement atteindre un plafond !