Le géant de Mountain View dévoile le successeur de son générateur d’images phénomène. Nano Banana 2 promet la qualité de la version Pro à la vitesse de Flash, et s’invite dans l’ensemble de l’écosystème Google. Tour d’horizon.

L’histoire commence par un nom de code resté célèbre. En août 2025, un modèle anonyme apparaît sur la plateforme d’évaluation communautaire Arena sous le surnom « Nano Banana », un clin d’œil aux surnoms donnés à Naina Raisinghani, Product Manager chez Google DeepMind. Le 26 août, Google officialise la chose : il s’agit de Gemini 2.5 Flash Image. En quelques semaines, le modèle devient un phénomène viral, notamment en Inde, où les internautes s’emparent massivement de la génération de figurines 3D photoréalistes à partir de selfies. Le bilan est spectaculaire : plus de 10 millions de nouveaux utilisateurs attirés vers l’application Gemini et plus de 200 millions de retouches d’images réalisées dans les premières semaines.

Mais c’est avec l’arrivée de Nano Banana Pro le 20 novembre 2025, adossé à Gemini 3 Pro Image, que Google a véritablement changé la donne. Ce modèle haut de gamme a repoussé les limites du photoréalisme au point de rendre la frontière entre image générée et photographie réelle quasi imperceptible. Contrôle avancé de l’éclairage et des angles caméra, rendu de texte lisible dans les images, composition à partir de 14 images sources tout en maintenant la cohérence visuelle de cinq personnages distincts : Nano Banana Pro s’est rapidement imposé en tête des classements LMArena, le benchmark communautaire de référence.

Une lutte au sommet de l’IA générative d’images

Ce succès n’est pas passé inaperçu chez la concurrence. La domination de Nano Banana Pro dans les classements a conduit OpenAI à accélérer le lancement de GPT Image 1.5, sorti mi décembre, quatre fois plus rapide que son prédécesseur et 20 % moins cher via l’API.

Depuis, les deux modèles se partagent le haut des classements, mais avec des profils distincts. GPT Image 1.5 excelle en vitesse d’itération, en respect strict des instructions et en préservation des logos et éléments de marque, un atout pour les flux de production marketing à haut volume. Nano Banana Pro, de son côté, reste la référence en matière de photoréalisme, de production de visuels en 4K, de qualité des textures, de rendu naturel des tons de peau et de cohérence visuelle sur des séries d’images. Les comparatifs publiés par plusieurs sites spécialisés convergent : aucun des deux n’a réellement pris le dessus et bien des utilisateurs utilisent les deux choisissant l’un ou l’autre selon le contexte.

Nano Banana 2 : le meilleur des deux mondes

C’est dans ce contexte que Google DeepMind annonce Nano Banana 2, techniquement baptisé Gemini 3.1 Flash Image. La promesse est claire : combiner la qualité, le raisonnement avancé et la connaissance du monde de Nano Banana Pro avec la rapidité d’exécution de la lignée Flash. Google parle de rendre accessibles au plus grand nombre des fonctionnalités autrefois réservées à la version Pro.

Ancrage dans la connaissance en temps réel. Nano Banana 2 s’appuie sur la base de connaissances de Gemini ainsi que sur des informations et des images issues de la recherche web en temps réel pour produire des visuels contextuellement plus précis. Le modèle peut générer des infographies, transformer des notes en diagrammes ou produire des visualisations de données. Pour illustrer cette capacité, Google a développé une application de démonstration baptisée « Window Seat », qui crée des vues photoréalistes de fenêtre inspirées de lieux réels et de données météo en direct.

Rendu de texte et localisation multilingue. Le modèle produit du texte lisible et précis directement intégré aux images : maquettes marketing, cartes de vœux, affiches. Plus notable encore : il permet de traduire et localiser du texte au sein même de l’image, dans plusieurs langues. Google a démontré cette capacité avec une démo « Global Ad Localizer » qui adapte une publicité pour différents marchés internationaux, en localisant simultanément le texte et les éléments visuels.

Cohérence des sujets et suivi des instructions. Nano Banana 2 maintient la cohérence visuelle de cinq personnages et la fidélité de 14 objets au sein d’un même flux de travail (selon la surface ; jusqu’à 10 objets dans l’application Gemini), ce qui ouvre la voie au storyboarding et à la création de récits visuels suivis. Le modèle adhère également plus strictement aux requêtes complexes et nuancées.

Résolution et formats. Le modèle prend en charge des résolutions allant du 512 px (nouveau palier optimisé pour les itérations rapides) au 4K, avec un support natif élargi des ratios d’aspect : aux formats existants s’ajoutent désormais le 4:1, 1:4, 8:1 et 1:8. Une souplesse que l’on ne retrouve que dans les modèles Banana Pro et dont ne dispose pas GPT-Image.

Fidélité visuelle. Google met en avant un éclairage plus vibrant, des textures plus riches et des détails plus nets par rapport au Nano Banana original, tout en conservant la vitesse attendue d’un modèle Flash.

Niveaux de raisonnement configurables. Côté développeurs, une nouveauté notable : la possibilité d’ajuster le niveau de raisonnement du modèle (Minimal par défaut, ou High/Dynamic) pour les prompts complexes, ce qui améliore significativement la qualité de sortie et l’adhérence aux instructions.

Un déploiement massif et des partenaires de poids

Le déploiement de Nano Banana 2 est le plus large jamais réalisé par Google pour un modèle d’image. Il remplace Nano Banana Pro par défaut dans l’application Gemini (modes Fast, Thinking et Pro), ainsi que dans Google Search (AI Mode et Lens, disponible dans 141 nouveaux pays et territoires, avec huit langues supplémentaires). Il devient le modèle par défaut dans Flow (sans coût de crédits) et alimente les suggestions de campagnes dans Google Ads.

Pour les développeurs, le modèle est disponible en preview via l’API Gemini, Gemini CLI, AI Studio, Google Antigravity, Firebase et Vertex AI sur Google Cloud. Un accès payant via clé API est requis dans AI Studio.

Les abonnés Google AI Pro et Ultra conservent l’accès à Nano Banana Pro pour les tâches spécialisées nécessitant une précision factuelle maximale, accessible via le menu contextuel de régénération.

L’écosystème de partenaires est déjà conséquent. Adobe intègre Nano Banana 2 dans Firefly. Figma l’utilise dans ses workflows Weavy. Notion l’exploite pour la génération de diagrammes et de visuels. WPP l’a testé avec des clients comme Unilever, constatant une réduction des délais de retouche de « plusieurs heures à quelques secondes ». La startup mode Whering l’utilise pour transformer des photos utilisateur de faible qualité en visuels de qualité studio.

Des limites à connaître

Nano Banana 2 n’est pas exempt de faiblesses. Google le reconnaît : les fonctionnalités avancées comme l’édition par masque, les changements majeurs d’éclairage (jour/nuit) ou la fusion de plusieurs images peuvent encore produire des résultats artificiels ou des artefacts visuels. La cohérence des personnages, bien qu’améliorée, n’est pas infaillible. Les requêtes très complexes ou les scénarios physiquement impossibles restent sources d’incohérences. Et s’il se rapproche fortement de la qualité Pro, il ne l’égale pas systématiquement sur les rendus les plus exigeants, d’où le maintien de Nano Banana Pro dans l’offre.

Traçabilité : SynthID et C2PA

Côté transparence, Google renforce son dispositif de traçabilité. Toutes les images générées portent un filigrane SynthID invisible, couplé aux Content Credentials C2PA pour offrir une vision non seulement de la présence d’IA dans la création, mais de la manière dont elle a été utilisée. Depuis son lancement en novembre, la fonction de vérification SynthID dans l’application Gemini a été utilisée plus de 20 millions de fois. La vérification C2PA sera bientôt ajoutée à l’application Gemini.

Avec Nano Banana 2, Google ne se contente pas d’itérer : il restructure sa gamme de modèles d’images en proposant un modèle polyvalent capable de couvrir l’essentiel des usages professionnels et grand public. Une démocratisation qui devrait encore servir le succès croissant de Gemini y compris sur mobiles. Et qui devrait aussi amener OpenAI à de nouveau réagir…