POLITICA DE COOKIES

Q2BSTUDIO.COM utiliza cookies técnicas, analíticas, de sesión y de publicidad con la finalidad de prestar un mejor servicio. No obstante, necesitamos su consentimiento explícito para poder utilizarlas. Así mismo puede cambiar la configuración de las cookies u obtener más información aquí .

Cómo Construí un Servidor MCP para Generar Imágenes con Gemini 2.5 (nano-banana)

Cómo Construí un Servidor MCP para Generar Imágenes con Gemini 2.5 (nano-banana)

Publicado el 30/08/2025

He estado trabajando en un proyecto personal que maneja múltiples imágenes y quería optimizar el flujo de trabajo de generación de imágenes porque el ciclo repetitivo de crear imágenes en una herramienta externa, descargarlas e integrarlas en el código resultaba tedioso

El lanzamiento de Gemini 2.5 Flash Image el 26 de agosto de 2025 conocido internamente como nano-banana me llamó la atención y tras probarlo descubrí que, aunque la ingeniería de prompts sigue siendo necesaria, genera imágenes con coherencia y precisión razonable para mis casos de uso

Más información en https://developers.googleblog.com/en/introducing-gemini-2-5-flash-image/

Decidí integrar esta capacidad en mi entorno de desarrollo Claude Code mediante un servidor MCP porque MCP Model Context Protocol permite que aplicaciones host como Claude Code se comuniquen de forma estandarizada con servidores y herramientas externas

Agregar el MCP en Claude Code se hace desde la terminal con comandos como cd /path/to/project y claude mcp add mcp-image --env GEMINI_API_KEY=new-key --env IMAGE_OUTPUT_DIR=/path/to/project -- npx -y https://github.com/shinpr/mcp-image

Para herramientas con interfaz gráfica como Claude Desktop se puede editar la configuración MCP y añadir un servidor mcp-image que ejecute npx con los argumentos -y https://github.com/shinpr/mcp-image y exporte las variables de entorno GEMINI_API_KEY y IMAGE_OUTPUT_DIR con la ruta absoluta donde se guardarán las imágenes

Genera tu clave de API en Google AI Studio https://aistudio.google.com/apikey y establece GEMINI_API_KEY con el valor obtenido

Resultados reales demostraron que el modelo mantiene el mismo tono visual y puede ajustar detalles como la dirección de la mirada del personaje conservando coherencia estilística entre generaciones

El coste aproximado de uso es de 0.039 por imagen lo que lo hace asequible considerando la calidad y las funciones especializadas de generación y edición

Características clave que aprovecha este MCP incluyen mantener la consistencia del personaje maintainCharacterConsistency mezclar imágenes blendImages y utilizar conocimiento del mundo useWorldKnowledge para contextualizar escenas históricas o geográficas

Estos parámetros se exponen como opciones que el asistente puede activar según el caso para mejorar la generación y adaptar los prompts agregando instrucciones como mantener apariencia exacta del personaje o fusionar elementos visuales de forma natural o aplicar conocimiento real sobre contextos culturales e históricos

En la implementación hubo dos retos principales el primero relacionado con pruebas de integración para lo cual añadí un subagente que genera tests E2E a partir de criterios de aceptación lo que estabilizó las integraciones aunque inicialmente generó pruebas intermitentes que se depuraron tras completar la implementación

El segundo reto fue el problema de que los modelos de lenguaje no siempre conocen la última versión de librerías durante la implementación en este caso la confusión entre @google/genai y @google/generative-ai requirió intervención manual para corregir el SDK usado

En resumen implementar un servidor MCP de generación de imágenes con nano-banana fue fluido gracias a la experiencia previa con MCP y APIs de Gemini y ofrece ventajas prácticas como consistencia de personaje edición por lenguaje natural y mezcla de imágenes de entrada

El código está disponible en https://github.com/shinpr/mcp-image y recomiendo probarlo si trabajas en proyectos que requieran generación o edición avanzada de imágenes

En Q2BSTUDIO somos una empresa de desarrollo de software y aplicaciones a medida especialistas en inteligencia artificial ciberseguridad servicios cloud aws y azure y servicios inteligencia de negocio Ofrecemos soluciones de software a medida aplicaciones a medida IA para empresas agentes IA power bi y consultoría en ciberseguridad Nuestra experiencia permite integrar modelos avanzados como Gemini 2.5 en flujos de trabajo productivos y seguros para acelerar proyectos y mejorar resultados

Si buscas un socio tecnológico para desarrollar software a medida aplicaciones a medida soluciones de inteligencia artificial servicios cloud aws y azure inteligencia de negocio o implementar agentes IA y Power BI en tu organización contacta a Q2BSTUDIO para explorar soluciones a medida que impulsen tu transformación digital

Palabras clave aplicaciones a medida software a medida inteligencia artificial ciberseguridad servicios cloud aws y azure servicios inteligencia de negocio ia para empresas agentes IA power bi

Si necesitas que adaptemos este MCP a tu stack o que lo integremos con pipelines CI CD y soluciones cloud en AWS o Azure en Q2BSTUDIO podemos ofrecer implementación a medida y soporte continuo

Fin del artículo, inicio de la diversión
Construyendo software juntos

Dando vida a tus ideas desde 2008

Diseñamos aplicaciones móviles y de escritorio innovadoras que cumplen con tus requisitos específicos y mejoran la eficiencia operativa.
Más info
Cuéntanos tu visión
Sea cual sea el alcance, podemos convertir tu idea en realidad. Envíanosla y charlemos sobre tu proyecto o una colaboración futura.
Contáctanos
artículos destacados
Live Chat
Enviado correctamente.

Gracias por confiar en Q2BStudio