En el mundo actual de servicios gestionados en la nube ofrecer experiencias de usuario excepcionales requiere repensar arquitectura y operaciones tradicionales. En Temporal enfrentamos este reto definiendo modelos de tenancy, gestión de recursos y ejecución durable para construir un servicio en la nube fiable y escalable. A continuación presentamos una versión adaptada de esa experiencia y cómo aplicamos esos principios al diseño de servicios gestionados.
Los servicios gestionados se han convertido en la opción por defecto para ofrecer soluciones alojadas a clientes. Alojar bases de datos, colas o tecnologías servidor permite mejorar la experiencia del cliente y abrir vías de monetización, especialmente para proyectos de código abierto. El reto es hacerlo de forma eficiente sin perder fiabilidad ni escalabilidad.
Una de las decisiones iniciales clave es el modelo de tenancy. La alternativa de single tenancy ofrece aislamiento y simplicidad pero resulta ineficiente: los clientes pagan por capacidad no utilizada y los proveedores asumen altos costes operativos. Multi tenancy es más complejo de implementar pero optimiza el uso de recursos, permite facturar por uso real y crea margen compartido para afrontar picos de tráfico.
Arquitectar un servicio gestionado separando plano de datos y plano de control es una buena práctica que adoptamos para dejar claras las responsabilidades. El plano de datos es donde ocurre el trabajo real: procesar transacciones, ejecutar workflows y manejar datos de clientes. Debe ofrecer alta disponibilidad, baja latencia y tolerancia a fallos. Para ello aplicamos una arquitectura basada en celdas que aísla recursos y minimiza el radio de impacto ante fallos.
El plano de control actúa como cerebro del sistema: gestiona recursos, crea namespaces y maneja configuraciones. Su rendimiento no exige la latencia extrema del plano de datos pero su fiabilidad es crucial para la experiencia del usuario. Operaciones como provisionar un namespace no siempre son urgentes pero las demoras o errores generan frustración.
En el plano de datos implementamos una arquitectura por celdas. Cada celda opera como una unidad autónoma con cuenta de proveedor de nube, redes privadas, clúster de Kubernetes y la infraestructura de soporte. Este diseño se aplica tanto en AWS como en GCP y permite que fallos o actualizaciones en una celda no afecten a las demás, reduciendo el riesgo de fallos en cascada.
Cada celda incluye pods de cómputo ejecutando servicios y herramientas de observabilidad, bases de datos primarias y sistemas de búsqueda para visibilidad, así como componentes adicionales como balanceadores, endpoints de conectividad privada y elementos para la integración entre entornos. Esta aproximación facilita atender necesidades diversas de clientes manteniendo fiabilidad a escala.
El desarrollo del plano de control planteó retos propios sobre fiabilidad y mantenibilidad. Tareas de control como provisionar namespaces o desplegar actualizaciones son procesos largos y compuestos por muchos pasos dependientes. Escribir esta lógica como código ad hoc provoca sistemas frágiles difíciles de depurar y evolucionar.
Aquí entra en juego el modelo de ejecución durable de Temporal. Inspirado en experiencias previas con servicios como AWS Simple Workflow y Azure Durable Functions, este modelo separa la lógica de negocio de la gestión del estado y del manejo de fallos. Los desarrolladores escriben workflows como código secuencial y natural sin preocuparse por reintentos, backoffs o persistencia de estado. El sistema se encarga de recuperar ejecuciones y mantener consistencia ante errores.
Un ejemplo práctico es la provisión de un namespace. Desde la petición en la interfaz se orquesta una serie de tareas: seleccionar una celda adecuada, crear registros y roles en bases de datos, generar y provisionar certificados mTLS y configurar rutas de ingreso verificando conectividad. Cada paso implica llamadas a APIs externas y propagación DNS. Sin ejecución durable manejar reintentos y estados complica enormemente el código. Con Temporal estas tareas se encapsulan en workflows que gestionan reintentos y conservación del estado de forma transparente.
Las actualizaciones incrementales y seguras también son escenarios naturales para el plano de control. Organizamos celdas en anillos de despliegue que progresan desde entornos preproducción hasta celdas con tráfico real siguiendo un orden de prioridad. El despliegue se realiza por lotes con pausas para observar métricas y detectar problemas como fugas de memoria o condiciones de carrera. Temporal permite que despliegues de larga duración, que pueden extenderse semanas, sean resilientes frente a reinicios y fallos.
Un patrón poderoso habilitado por la ejecución durable son las entity workflows. Son workflows vinculados a recursos concretos como celdas o namespaces y modelan de forma natural el estado y las operaciones. En Temporal Cloud cada celda tiene un workflow entidad que gestiona su ciclo de vida desde provisionamiento hasta actualizaciones, simplificando control concurrente y garantizando consistencia.
El mayor impacto de este enfoque se nota en la experiencia del desarrollador. Al eliminar la necesidad de escribir código repetitivo para reintentos, backoffs y gestión de estado, los equipos pueden centrarse en aportar valor de negocio. Las herramientas integradas de observabilidad y depuración de workflows facilitan entender y solucionar sistemas complejos. Desarrolladores satisfechos son más productivos y cometen menos errores.
La ejecución durable no es solo una innovación técnica sino un cambio de paradigma para construir sistemas nativos en la nube. Al desacoplar la lógica de negocio de la gestión de estado y fallos, se reduce el esfuerzo necesario para crear sistemas fiables y escalables. Esto aplica a planos de control, orquestación de recursos, transferencias monetarias, entrenamiento de modelos de IA o procesamiento masivo de contenidos.
En Q2BSTUDIO como empresa de desarrollo de software ofrecemos servicios integrales para aprovechar estos enfoques. Somos especialistas en desarrollo de aplicaciones a medida y software a medida, integración de inteligencia artificial, ciberseguridad y servicios cloud AWS y Azure. Diseñamos arquitecturas escalables, implementamos soluciones con ejecución durable y adoptamos patrones que mejoran la fiabilidad operativa. También proveemos servicios de inteligencia de negocio y soluciones con Power BI para convertir datos en decisiones, así como desarrollo de agentes IA e IA para empresas que automatizan procesos y potencian el negocio.
Si estás construyendo o planeando un servicio gestionado considera cómo la ejecución durable puede simplificar tu camino y abrir nuevas posibilidades. En Q2BSTUDIO ayudamos a diseñar y desplegar sistemas robustos en la nube, optimizados para aplicaciones a medida y necesidades específicas de cada cliente. Contacta con nosotros para explorar soluciones en inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, agentes IA y power bi.
Palabras clave para posicionamiento: aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA, power bi.