Gemini 3.5 Flash n’a plus grand-chose d’un modèle « allégé ». Google en fait dès aujourd’hui un moteur rapide, puissant et bon marché pour faire tourner des agents IA capables de coder, raisonner, itérer et piloter des tâches longues.

L’IA frontière continue d’accélérer. Dans tous les sens du terme. Trois mois à peine après le lancement de Gemini 3.1, Google dévoile déjà la prochaine génération : Gemini 3.5.
À Google I/O 2026, qui se tient cette semaine, l’éditeur a en effet lancé le premier représentant de la nouvelle famille : Gemini Flash 3.5. Avec deux idées fortes à la clé. La première c’est que le modèle Flash fait mieux que le modèle Pro précédent en plus rapide et beaucoup moins cher. La seconde, c’est que le modèle est ancré dans les usages agentiques à venir.
Avec Gemini 3.5 Flash, Google ne lance pas seulement une nouvelle version « rapide » de son modèle IA. Il repositionne Flash comme moteur d’exécution pour agents, code, interfaces génératives et workflows métiers complexes.

Un modèle rapide et néanmoins très puissant

Longtemps, la gamme Flash a incarné le compromis raisonnable : moins de puissance que les grands modèles phares, mais davantage de vitesse et de sobriété. Avec Gemini 3.5 Flash, Google veut casser cette hiérarchie. Le modèle est présenté comme le premier représentant de la famille Gemini 3.5, en attendant une version Pro annoncée pour le mois prochain, et vise explicitement les usages agentiques longue durée : planifier, appeler des outils, coder, itérer, vérifier, recommencer.

La promesse est simple : apporter une intelligence de niveau « frontier » sans sacrifier la latence. Google affirme que Gemini 3.5 Flash surpasse Gemini 3.1 Pro sur plusieurs bancs d’essai de code et d’agentique, avec notamment 76,2 % sur Terminal-Bench 2.1, 1656 Elo sur GDPval-AA, 83,6 % sur MCP Atlas et 84,2 % sur CharXiv Reasoning pour la compréhension multimodale. L’éditeur revendique aussi une génération quatre fois plus rapide, en tokens de sortie par seconde, que d’autres modèles frontières.

Le moteur de l’agentique chez Google

Mais le vrai sujet est ailleurs. Gemini 3.5 Flash illustre le basculement de l’IA conversationnelle vers l’IA d’exécution. Dans les démonstrations citées par Google, le modèle ne se contente pas de répondre : il transforme une base de code legacy vers Next.js, mobilise deux agents pour synthétiser AlphaZero et coder un jeu jouable en six heures, catégorise automatiquement des actifs non structurés ou génère plusieurs approches UX d’un tunnel de paiement en 60 secondes.

Cette orientation est stratégique pour les développeurs. Couplé à Google Antigravity, le modèle devient un orchestrateur de sous-agents capables de travailler en parallèle sur des tâches longues, sous supervision humaine.
Mais le modèle est surtout la fondation des nouveaux enjeux « grand public » de l’IA agentique. Gemini 3.5 Flash devient le modèle par défaut de l’application Gemini et du mode IA de Google Search. Il alimente aussi Gemini Spark, l’agent personnel de Google, censé agir en continu sous contrôle de l’utilisateur.
Avec un tel déploiement, le modèle aura nécessairement un impact massif puisqu’il devient le moteur invisible d’agents intégrés à Search, Android, Workspace, AI Studio et Gemini Enterprise. Une façon aussi de démontrer la confiance que Google affiche déjà dans cette nouvelle arme.

Gemini 3.5 Flash marque une nouvelle étape : après la qualité des réponses, la prochaine frontière des modèles IA est bien la qualité de l’exécution.

 

____________________________

À lire également :

Gemini 3.1 Pro : Google accélère dans la course aux modèles frontières

Gemini Intelligence : Android devient un OS agentique

Google Workspace Intelligence : Google étoffe Gemini avec une couche contextuelle qui lui manquait

Gemini 3 Flash : quand l’IA de pointe passe à la vitesse supérieure