Detrás del nombre interno Nano Banana 2 se encuentra Gemini 3.1 Flash Image. Con tres modelos ya dentro de la familia Nano Banana, Google intenta aclarar qué versión deberían elegir desarrolladores y creadores según cada tipo de tarea.

Nano Banana 2 está pensado como la opción predeterminada
Nano Banana 2 está pensado como la opción predeterminada

Nano Banana 2 está pensado como la opción predeterminada

Según Google, Nano Banana 2 ofrece aproximadamente el 95% de las capacidades del más caro Nano Banana Pro, pero a un coste mucho menor. Para la mayoría de los proyectos nuevos, Google recomienda NB2 como la opción estándar.

Los precios por resolución de salida son los siguientes:

  • 0.5K: NB2 cuesta 0,045 dólares, mientras que Pro no está disponible;

  • 1K: NB2 cuesta 0,067 dólares, frente a 0,134 dólares de Pro;

  • 2K: NB2 cuesta 0,101 dólares, frente a 0,134 dólares de Pro;

  • 4K: NB2 cuesta 0,151 dólares, frente a 0,240 dólares de Pro.

Google señala que los desarrolladores solo deberían pasar a Nano Banana Pro en el caso de prompts muy complejos, multicapa, o tareas con exigencias lógicas inusualmente altas que NB2 no pueda resolver. Eso mantiene a Pro como el modelo de imagen más avanzado de la compañía.

El antiguo Nano Banana 1 sigue siendo la opción más barata y rápida, ya que no es un llamado modelo de razonamiento. Google no está obligando a los usuarios a migrar desde esa versión.

Aun así, para quienes estén construyendo nuevos flujos de trabajo que requieran más matices, un mejor seguimiento de prompts o nuevas funciones de grounding, Google recomienda pasar directamente a NB2. Un detalle práctico es que generar imágenes de 512 píxeles con NB2 cuesta aproximadamente lo mismo que usar NB1.

La búsqueda de imágenes en la web es la función estrella de NB2

La novedad más importante de Nano Banana 2 es el grounding visual con Google Search.

Mientras que Nano Banana Pro ya podía recuperar información textual desde la web, NB2 va un paso más allá al poder buscar imágenes en internet para comprender mejor cómo son los objetos reales antes de generarlos.

Google afirma que esta función de image grounding funciona especialmente bien con lugares concretos como iglesias, puentes o plazas, así como para diferenciar especies exactas de animales y plantas. La compañía mostró esta capacidad utilizando una iglesia en Voiron, Francia, y enseñando cómo el modelo puede distinguir visualmente entre dos especies de mariposas.

Ejemplos de image grounding de Google | Imagen: Google
Ejemplos de image grounding de Google | Imagen: Google

La función no funciona con personas.

Por ahora, el image grounding parece estar disponible solo a través de la API, y no dentro de la aplicación Gemini. Google remite a los desarrolladores a los detalles de implementación en su documentación y en un cuaderno oficial de Python Colab.

Las nuevas resoluciones y proporciones extremas buscan reducir costes

Nano Banana 2 también puede generar imágenes con resolución de 512 píxeles, lo que acelera la generación y reduce el coste hasta un nivel similar al de Nano Banana 1.

Google recomienda un flujo de trabajo en varios pasos: usar la Batch API, que ofrece un 50% de descuento, para generar primero docenas de variantes en 512 px, y luego ampliar la mejor composición a 1K, 2K o 4K.

NB2 también introduce soporte para relaciones de aspecto extremas como 1:8 y 1:4, tanto en formato vertical como horizontal. Google dice que estos formatos son útiles para banners web, contenidos basados en scroll o diseños de cómic al estilo franco-belga.

En comparación con Nano Banana Pro, NB2 ofrece:

  • Máximo de tokens de entrada: 131.072 frente a 65.536;

  • Máximo de tokens de salida: 32.768 en ambos casos;

  • Resoluciones: 0.5K, 1K, 2K y 4K para NB2 frente a 1K, 2K y 4K para Pro;

  • Relaciones de aspecto: formatos estándar más 1:4, 4:1, 1:8 y 8:1 para NB2;

  • Text grounding: sí en ambos;

  • Image grounding: sí en NB2, no en Pro;

  • Entradas de imágenes de referencia: hasta 14 en ambos;

  • Entradas de documentos: texto y PDF en ambos;

  • Salidas: texto e imágenes en ambos;

  • Base de conocimiento: enero de 2025 en ambos;

  • Búsqueda web en tiempo real: sí en ambos;

  • Estándares de seguridad: credenciales de contenido C2PA y marca de agua SynthID en ambos.

Google también dio recomendaciones sobre el modo thinking del modelo. La compañía dice que debería permanecer desactivado por defecto, ya que en la generación de imágenes común principalmente añade tiempo y coste computacional. Solo debería activarse en tres casos: cuando el modelo produzca resultados absurdos, al crear infografías muy complejas o al combinar image grounding con razonamiento espacial.

Conclusión

Google está posicionando claramente a Nano Banana 2 como la nueva opción principal para la generación de imágenes dentro del ecosistema Gemini. Al combinar costes más bajos con capacidades más amplias, como el grounding visual y las relaciones de aspecto extremas, la compañía busca hacer que los flujos de trabajo avanzados de imagen sean más prácticos para el uso diario de los desarrolladores.