Google ha presentado Gemini 2.5 Flash Image, también conocido como Nano Banana, un modelo avanzado para generación y edición de imágenes que habilita casos de uso de última generación en creación visual, retoque, composición y restauración. Si eres desarrollador, esta guía te muestra cómo integrarlo en tus aplicaciones a través de la Gemini Developer API y cómo sacar el máximo partido a sus capacidades multimodales. Además, en Q2BSTUDIO te ayudamos a convertir estas capacidades en productos reales con aplicaciones a medida, software a medida e iniciativas de inteligencia artificial e ia para empresas.
En esta guía verás de forma práctica: uso en AI Studio, configuración de proyecto, generación de imágenes a partir de texto, edición con texto e imagen, restauración fotográfica, entradas múltiples, edición conversacional, mejores prácticas y recursos de comunidad, más un cierre con referencias útiles.
1) Uso de Nano Banana en Google AI Studio. Aunque las personas usuarias pueden acceder al modelo desde la app de Gemini, el entorno ideal para prototipar prompts y flujos es Google AI Studio. Entra en aistudio.google.com, inicia sesión con tu cuenta de Google y elige el modelo Nano Banana desde el selector. También puedes abrir una sesión directa con el enlace corto ai.studio/banana. AI Studio es gratuito para prototipar, y es la puerta de entrada para luego consumir la API en tus propios servicios.
Consejo. En AI Studio puedes experimentar con pequeñas apps web y explorar ejemplos listos para usar, lo que acelera tu iteración antes de escribir código.
2) Configuración del proyecto. Necesitarás: una clave de API desde Google AI Studio, la facturación activada en tu proyecto de Google Cloud y el SDK de Google Gen AI para Python o JavaScript TypeScript. A) Genera una clave de API desde el panel izquierdo de AI Studio, selecciona o crea un proyecto de Google Cloud y guarda la clave de forma segura. B) Activa la facturación para usar la API de pago fuera del entorno gratuito de AI Studio. C) Instala el SDK correspondiente. En Python bastará con instalar google-genai y una librería de imágenes como Pillow. En JavaScript TypeScript instala el paquete @google/genai.
Coste. La generación de imágenes con Nano Banana cuesta aproximadamente 0.039 USD por imagen de salida estándar 1024x1024. La tarifa oficial es 0.30 USD por millón de tokens de entrada y 30 USD por millón de tokens de salida. Un resultado típico consume unos 1290 tokens.
3) Generación de imágenes desde texto. Usa el identificador de modelo gemini-2.5-flash-image-preview. Redacta un prompt descriptivo y claro indicando sujeto, estilo, iluminación y encuadre. La respuesta del modelo es multimodal y puede incluir texto y datos de imagen. En tus integraciones, extrae la parte de imagen y guárdala en el formato deseado.
4) Edición de imágenes con texto e imagen. Proporciona una imagen existente y un prompt que describa los cambios. El modelo mantiene muy bien la coherencia del personaje u objetos originales, por ejemplo para cambiar el fondo, el estilo, la pose o la ambientación, respetando rasgos clave del input.
5) Restauración fotográfica. Con un prompt conciso puedes recuperar fotografías antiguas, eliminar artefactos, mejorar nitidez y colorizar escenas. Es ideal para archivos históricos, colecciones familiares o catálogos que requieren mejoras de calidad.
6) Trabajo con múltiples imágenes de entrada. Combina varias imágenes para lograr ediciones compuestas, sustitución realista de objetos o transferencia de estilo. Indica en el prompt qué contenido debe mantenerse y qué elementos deben fusionarse o transformar.
7) Edición conversacional. Crea sesiones de chat para iterar sucesivos cambios manteniendo el contexto, ideal para refinamientos graduales en una misma línea creativa. Consejo. Si tras muchas iteraciones notas deriva en detalles, inicia una nueva sesión con la última imagen y un prompt más consolidado para mantener alta fidelidad.
8) Mejores prácticas de prompting para Nano Banana. Sé extremadamente específico con sujetos, colores, iluminación, lentes y composición. Explica el contexto y la intención creativa. Itera por pasos y refina. Divide escenas complejas en instrucciones secuenciales. Enfoca en positivo en lugar de listar prohibiciones. Controla la cámara con términos fotográficos como gran angular, macro, plano cenital o perspectiva a ras de suelo para orientar el encuadre.
9) Ejemplos de la comunidad y fuentes de inspiración. Cambios de perspectiva de cámara por @henrydaubrez en X. Consistencia de personajes con few shot por @multimodalart en X. Transformaciones tipo flecha roja de Google Maps por @tokumin en X. Generación desde esqueletos y anotaciones por @yachimat_manga en X. Modelado 3D desde fotos por @deedydas en X. Experiencias AR basadas en ubicación por @bilawalsidhu en X. Conversión de mapas 2D a gráficos 3D por @demishassabis en X.
10) Recursos y siguientes pasos. Prueba el modelo en Google AI Studio, revisa la documentación de la Gemini API y la guía de generación de imágenes en documentación oficial. Para mejorar tu prompting, revisa el artículo de buenas prácticas específico de Gemini 2.5 Flash Image y la guía de prompt en la documentación.
Cómo puede ayudarte Q2BSTUDIO. En Q2BSTUDIO somos una empresa de desarrollo con foco en aplicaciones a medida y software a medida, especialistas en inteligencia artificial, agentes IA, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio y power bi. Integramos modelos como Nano Banana en pipelines reales, desplegamos APIs seguras y escalables y automatizamos flujos creativos con calidad de producción. Si quieres llevar estas capacidades a tus productos, descubre nuestros servicios de IA en inteligencia artificial para empresas y cómo convertimos ideas en productos nativos multiplataforma en desarrollo de aplicaciones a medida.
Conclusión. Con Gemini 2.5 Flash Image puedes generar imágenes fotorrealistas, editar con precisión, restaurar fotos y construir experiencias conversacionales de edición. Empieza prototipando en AI Studio, consolida tus prompts con las mejores prácticas y da el salto a producción con una arquitectura sólida. Si buscas un socio para acelerar el time to value con inteligencia artificial, ciberseguridad y servicios cloud aws y azure, cuenta con la experiencia de Q2BSTUDIO para impulsar tu roadmap con resultados medibles.