Parte 6A: SaijinOS Ligero: Núcleo de 20 Personas, Sincronización BPM y un Recorte de Repositorio del 99.99%
Rehicimos SaijinOS alrededor de un núcleo ligero para priorizar presencia y latencia como parte de la experiencia. El resultado es un sistema de 20 personas, respuestas sincronizadas por BPM, backend con FastAPI y cliente en Flutter, cobertura completa de pruebas y una reducción del repositorio de aproximadamente 9 GB a 557 KB.
Por qué importa: la IA a ritmo humano necesita latencia como característica, no como fallo. Las personas deben ser declarativas y rutables para facilitar iteración rápida. Entregar supera acumular: un despliegue limpio permitió volver a iterar sin bloqueos.
Estrategia de despliegue ligera
Separamos entornos virtuales y modelos fuera del repositorio. Creamos un repositorio limpio llamado sajinos en la rama lightweight-deploy que contiene solo código y documentación. Los artefactos pesados se generan con scripts de setup, evitando blobs en el historial. Resultado práctico: repositorio reducido de ~9 GB a ~557 KB, arranque en frío inferior a 3 segundos y latencia de API promedio inferior a 100 ms en local.
Sistema de 20 personas declarado en YAML
Cada persona define tono, política de rechazo y ciclo de respiración o pacing de respuesta. Un ejemplo esquemático en YAML: id miyu role music-bpm-sync tone gentle modes calm reply_delay gentle grounding minimal storm reply_delay extended grounding - Esta bien. Tomemos un momento. - Sin prisa — estoy aquí. breath_cycle inhale_wait_exhale El enrutamiento selecciona persona según el contexto y la banda BPM.
Bandas BPM sincronizadas
Definimos bandas de energía para adaptar retrasos, verbosidad y mensajes de grounding: 60 a 80 baja energia y reassurance, 81 a 120 cooperación balanceada, 121 a 180 coaching de alta energia. Esta mapeo permite respuestas que parecen respirar y acompañar al usuario.
Core FastAPI
El backend ligero expone siete endpoints, incluido listado de personas y enrutamiento por BPM y contexto. CORS habilitado para la UI en Flutter y latencias medias por debajo de 100 ms en entornos locales.
Pruebas y calidad
Cuatro suites de pruebas pasan sin fallos en aproximadamente 2 segundos cubriendo API y lógica de enrutamiento y bandas BPM.
Qué es público y qué es privado
Publico: API, lógica de enrutamiento, esquema de personas y documentación. Privado: prompts de producción, credenciales de proveedores y modelos pesados.
Repos y ramas
Repositorio core: sajinos. Ramas destacadas: 17-persona-system para experimentos y lightweight-deploy como baseline de despliegue limpio.
Próximos pasos
Demo GIF de timers de respiración en la UI, expansión de personas de 20 a 30 con notas de evaluación y posible build movil. Estamos explorando cómo integrar agentes IA y capacidades de IA para empresas sin sacrificar rapidez ni transparencia.
Sobre Q2BSTUDIO
En Q2BSTUDIO somos una empresa de desarrollo de software y aplicaciones a medida especializada en inteligencia artificial, ciberseguridad y servicios cloud aws y azure. Ofrecemos soluciones de software a medida para empresas que necesitan agentes IA, automatización, servicios de inteligencia de negocio y despliegues seguros. Si busca potenciar su estrategia con soluciones de IA para empresas y agentes IA consulte nuestra página de Inteligencia artificial y descubra cómo diseñamos arquitecturas que respetan latencia humana y privacidad. Para proyectos de producto y aplicaciones multiplataforma visite nuestra oferta de software a medida.
Palabras clave integradas: aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA y power bi para posicionamiento y búsquedas relacionadas.
Contacto y enlaces
Este artículo forma parte de la serie SaijinOS. Para más detalles técnicos y enlaces al código consulte las ramas publicadas y la documentación del proyecto.