Imagina convertir un simple prompt de texto en una imagen de alta calidad con pocas acciones. Qwen Image lo hace posible al combinar generación avanzada de imágenes con renderizado de texto preciso en inglés y chino. Se adapta a escenas fotorrealistas, estilos pictóricos impresionistas y diseños minimalistas. Además, incluye edición potente con instrucciones en lenguaje natural para insertar o quitar objetos, ajustar colores y detalles, editar texto dentro de la imagen y modificar poses humanas. Por debajo, puede realizar detección de objetos, segmentación semántica, estimación de profundidad y super resolución, ofreciendo un conjunto completo para crear y perfeccionar imágenes con facilidad.
Empezar es sencillo. A continuación verás cómo instalar Qwen Image y ejecutar tu primer prompt en minutos.
Requisitos mínimos
GPU 1x H100
Almacenamiento 50 GB recomendable
VRAM al menos 64 GB
Anaconda instalada
Proceso paso a paso para instalar y ejecutar Qwen Image
Paso 1 Crear una cuenta en tu proveedor cloud. En este tutorial usamos como ejemplo NodeShift por su relación precio rendimiento y cumplimiento normativo, pero puedes usar cualquier proveedor de confianza y seguir los mismos pasos.
Paso 2 Crear un nodo con GPU. Accede al panel, ve a la sección de nodos GPU y crea tu primer nodo.
Paso 3 Seleccionar configuración de GPU y almacenamiento. Elige una GPU compatible por ejemplo H100 o H200 y asigna almacenamiento suficiente por ejemplo 200 GB. Selecciona la región más cercana a tus usuarios o a tus datos.
Paso 4 Elegir autenticación. Puedes usar contraseña o clave SSH. Se recomienda clave SSH por seguridad. Crea y carga tu clave pública en el proveedor antes de desplegar.
Paso 5 Elegir imagen del sistema. Selecciona una imagen con Nvidia Cuda preinstalada para asegurar compatibilidad con drivers y librerías.
Paso 6 Conectarte al nodo por SSH. Cuando el estado aparezca como Running, conecta con un comando similar a ssh usuario@IP_SERVIDOR -p PUERTO. Si usas clave SSH añade el parámetro -i RUTA_CLAVE_SSH. Verifica la GPU ejecutando nvidia-smi.
Paso 7 Preparar el entorno con dependencias
Crear entorno con Anaconda
conda create -n qwen-img python=3.11 -y
conda activate qwen-img
Instalar PyTorch con CUDA 12.1
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
Instalar librerías necesarias
pip install einops timm pillow
pip install git+https://github.com/huggingface/transformers
pip install git+https://github.com/huggingface/accelerate
pip install git+https://github.com/huggingface/diffusers
pip install huggingface_hub
pip install sentencepiece bitsandbytes protobuf decord numpy
Instalar y lanzar Jupyter
conda install -c conda-forge --override-channels notebook -y
conda install -c conda-forge --override-channels ipywidgets -y
jupyter notebook --allow-root
Si tu servidor es remoto, habilita el túnel para acceder al Notebook desde tu navegador local
ssh -L 8888:localhost:8888 -p PUERTO -i RUTA_CLAVE_SSH usuario@IP_SERVIDOR
Copia la URL con el token que muestra la consola del servidor y pégala en tu navegador local para abrir Jupyter.
Paso 8 Descargar y ejecutar el modelo
Desde un cuaderno de Jupyter crea un pipeline de Diffusers con el repositorio Qwen slash Qwen-Image, activa bfloat16 si usas GPU compatible y mueve el pipeline a cuda. Define un prompt de texto en inglés o chino y genera la imagen con un número de pasos de inferencia por ejemplo 50, true cfg scale 4.0, tamaño según el aspecto que prefieras por ejemplo 16:9 con 1664x928 y una semilla fija para reproducibilidad por ejemplo 42. Guarda el resultado en un archivo como example.png.
Sugerencias rápidas
Para texto nítido añade al prompt Ultra HD 4K composición cinematográfica o su equivalente en chino.
Si no quieres forzar la eliminación de conceptos usa negative prompt vacío.
Prueba relaciones de aspecto 1:1 4:3 3:2 16:9 y 9:16 para redes sociales o banners.
Conclusión
Qwen Image transforma prompts en imágenes impactantes de alta fidelidad y facilita ediciones complejas con instrucciones naturales. Con unas pocas instalaciones vía Diffusers y un entorno CUDA, en minutos estarás generando tus primeros visuales. Si lo ejecutas en la nube podrás escalar la inferencia, automatizar flujos y versionar tus pipelines de forma segura.
Cómo te ayuda Q2BSTUDIO
En Q2BSTUDIO desarrollamos aplicaciones a medida y software a medida integrando inteligencia artificial de última generación en entornos productivos. Diseñamos pipelines de generación de imágenes, agentes IA y MLOps listos para producción, con monitorización, observabilidad y seguridad extremo a extremo. Si buscas impulsar ia para empresas con casos reales de valor, descubre nuestros servicios de inteligencia artificial y confía en un equipo experto en orquestación, evaluación y despliegue.
También modernizamos y optimizamos tus infraestructuras con servicios cloud aws y azure, reforzamos tu postura de ciberseguridad con mejores prácticas y pentesting, y potenciamos la toma de decisiones con servicios inteligencia de negocio y power bi. Integramos automatización de procesos de extremo a extremo para acelerar operaciones, reducir costes y mejorar la resiliencia.
Palabras clave útiles para tu proyecto aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA, power bi, automatización de procesos.