Resumen En mi primer intento de crear una aplicación impulsada por inteligencia artificial aprendí algo esencial: no se trata solo de modelos y prompts, sino de toda la infraestructura alrededor. Lo que parecía un proyecto sencillo para convertir videos en artículos optimizados para SEO terminó siendo una lección práctica sobre arquitecturas, límites de plataforma y experiencia de usuario.
La idea inicial Convertir videos de YouTube e Instagram en posts listos para publicar. Flujo pensado: el usuario sube un video, se extrae el audio y se envía a Whisper para transcripción, luego un LLM como GPT o Gemini transforma el texto en un artículo SEO optimizado y el usuario descarga el resultado. Sencillo en papel, complejo en producción.
Problemas reales encontrados El primer obstáculo fue el límite de 25MB de Whisper en las subidas. Los videos de calidad superan con facilidad ese tamaño. Intenté extraer audio con servicios como ImageKit pero los costes y límites del plan gratuito rápidamente bloquearon el desarrollo. La alternativa de procesar con FFmpeg en mi propio servidor chocó con la falta de recursos económicos durante la fase inicial.
Límites de ejecución en servidores sin servidor Todo funcionaba en local pero al desplegar en Vercel apareció un error 504 por timeouts de funciones. Mi pipeline tardaba más de 60 segundos sumando subida, procesamiento de audio, transcripción con Whisper y optimización con GPT. Planes serverless como Vercel y Netlify imponen límites de tiempo que convierten tareas de IA de larga duración en una mala pareja con el modelo request response.
Aprendiendo sobre arquitectura La lección clave fue entender que las aplicaciones de IA requieren procesamiento asíncrono y trabajos en segundo plano. Migré la lógica hacia un sistema de colas y workers para evitar timeouts y mejorar la experiencia. Opciones consideradas: Inngest por su experiencia de desarrollador y plan gratuito, BullMQ sobre Redis, AWS SQS para escalabilidad empresarial y soluciones DIY con Redis.
Solución adoptada Implementé colas con Inngest para orquestar trabajos en background. Ahora una petición API en NextJS encola el trabajo y responde inmediatamente con un estado de procesamiento. Un worker procesa el audio con FFmpeg o servicios de extracción, llama a Whisper para transcripción, luego a GPT/Gemini para optimización y finalmente notifica al usuario mediante WebSockets o correo. Para seguimiento y persistencia uso Supabase para registrar estados y Cloudinary para almacenamiento y manipulación de video.
Lecciones técnicas Diseñar con procesos asíncronos desde el día uno mejora la experiencia: indicadores de progreso en tiempo real, notificaciones al completar, pantallas para consultar estado y reintentos automáticos al fallar. Investiga límites de la plataforma antes de codificar: tiempos máximos de ejecución, memoria, costes por overages y límites de tamaño de archivo.
Errores que duelen menos cuando se detectan pronto Localmente todo funciona pero en producción aparecen latencias, límites y condiciones de error distintas. Prueba en entornos parecidos a producción pronto y monitoriza colas y workers. La infraestructura suele ser más desafiante que conseguir buenas respuestas de un modelo de IA.
Nuevo stack y mejoras En la reconstrucción prioricé background jobs, tracking y experiencia del usuario. Tecnologías seleccionadas: NextJS en el frontend con indicadores de progreso en tiempo real, Inngest para orquestación de jobs, Supabase para tracking de estado, Cloudinary para manejo de video y almacenamiento, WebSockets para notificaciones, y herramientas como LangChain o Langraph para flujos de IA más complejos. Para caching y sesiones consideré Redis y para analítica e inteligencia de negocio integro Power BI cuando hace falta.
Recomendaciones para desarrolladores Planifica la asincronía desde el inicio, investiga límites de la plataforma, comienza con jobs en background y prioriza UX para operaciones largas. Considera costes de infraestructura y diseña para reintentos y observabilidad.
Sobre Q2BSTUDIO En Q2BSTUDIO somos una empresa de desarrollo de software y aplicaciones a medida especializada en soluciones de inteligencia artificial y ciberseguridad. Ayudamos a empresas a desplegar IA para empresas, agentes IA y servicios cloud AWS y Azure, además de ofrecer servicios inteligencia de negocio y consultoría en power bi. Nuestro enfoque combina experiencia en software a medida y aplicaciones a medida con buenas prácticas de seguridad y escalabilidad para que los proyectos de IA lleguen a producción de manera fiable.
Palabras clave y posicionamiento Si necesitas asistencia con aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA o power bi, en Q2BSTUDIO podemos ayudarte a diseñar la arquitectura adecuada, implementar colas y workers, optimizar costes y asegurar la entrega de valor a tus usuarios.
Reflexión final El aprendizaje más grande fue darse cuenta que la IA suele ser la parte fácil. El reto real es orquestar la infraestructura, garantizar fiabilidad, controlar costes y ofrecer una experiencia de usuario que no dependa de timeouts. Si estás desarrollando una app con IA prioriza arquitectura, pruebas en entornos reales y mecanismos de procesamiento asíncrono desde el principio.
Invitación ¿Has experimentado límites similares con plataformas serverless al construir IA? Compártenos tu experiencia y si necesitas apoyo en diseño e implementación, contacta con Q2BSTUDIO para encontrar la solución adecuada a tu proyecto.