POLITICA DE COOKIES

Q2BSTUDIO.COM utiliza cookies técnicas, analíticas, de sesión y de publicidad con la finalidad de prestar un mejor servicio. No obstante, necesitamos su consentimiento explícito para poder utilizarlas. Así mismo puede cambiar la configuración de las cookies u obtener más información aquí .

Construyendo Gaia: Bot de voz para atención al cliente

Construyendo Gaia: un bot de voz para la atención al cliente

Publicado el 01/09/2025

Hola a todos, soy Fabien, CEO de ContactMedia, un centro de relación con clientes con sede en Aviñón, Francia. Aunque no soy desarrollador, nuestro equipo decidió asumir un reto técnico importante: construir nuestro propio voicebot, al que llamamos Gaia.

En este artículo comparto nuestro recorrido: por qué lo construimos, qué stack tecnológico utilizamos, los desafíos que surgieron y las lecciones que aprendimos en el camino.

Por qué construir en lugar de comprar

Al evaluar voicebots, descubrimos que las soluciones listas para usar eran o bien demasiado rígidas para adaptarse a los flujos de nuestros clientes, o bien demasiado costosas para experimentar de forma continua. Elegimos el camino difícil y construimos el nuestro. No buscábamos competir con gigantes, sino crear un bot a medida, flexible y fácil de iterar y entrenar.

Arquitectura principal

Como la mayoría de voicebots, Gaia se apoya en tres componentes clave:

Speech to Text STT: convierte la voz del cliente en texto. Probamos Google Speech to Text y Whisper de OpenAI. Whisper ofreció una precisión excelente en entornos ruidosos, aunque con mayor latencia.

Natural Language Understanding NLU: extrae la intención del texto. Empezamos con Rasa NLU y también probamos Dialogflow. Rasa nos dio más flexibilidad para entrenar intents específicos de dominio.

Text to Speech TTS: transforma las respuestas en voz. Evaluamos Amazon Polly y Microsoft Azure TTS. Las voces neuronales de Azure ofrecieron la experiencia más natural en francés.

Orquestamos todo con un backend en Node.js conectado a APIs de telefonía SIP para el manejo de llamadas en tiempo real.

Gestión de la complejidad del mundo real

Acentos y dialectos: el francés presenta fuertes variaciones regionales. Entrenar modelos de lenguaje con nuestros propios datos de llamadas mejoró notablemente la precisión.

Interrupciones y solapamientos: los clientes a menudo hablan encima del bot. Implementamos barge in para que Gaia deje de hablar cuando el interlocutor retoma la conversación.

Lógica de fallback: ningún NLU es perfecto. Diseñamos rutas claras de recuperación confirmando intención, pidiendo aclaraciones o escalando a un agente humano.

Latencia: incluso un retraso de 500 ms se percibe antinatural en una llamada. Optimizar toda la canalización, especialmente TTS, fue crítico.

Cómo medimos el éxito

No queríamos evaluar a Gaia solo por el número de llamadas automatizadas. Seguimos métricas como tasa de éxito de la tarea por ejemplo reservar una cita, tiempo medio de gestión y encuestas de satisfacción. Hasta ahora, Gaia resuelve alrededor del 60 por ciento de las llamadas de agendamiento sin ayuda humana.

Lecciones clave

Comienza con casos de uso acotados. La programación de citas fue el mejor punto de entrada.

Diseña para la escalada. El cliente debe saber que puede llegar a una persona.

Entrena de forma continua. Aparecen nuevos modismos, acentos y casuísticas, y el bot debe evolucionar.

La latencia es experiencia de usuario. Los usuarios perdonan errores, pero no pausas largas.

Qué sigue

Estamos explorando análisis de sentimiento para detectar frustración, mejor manejo de contexto en conversaciones de múltiples turnos y el uso de LLMs afinados como GPT-4o-mini para diálogos más naturales.

Reflexión final

Construir Gaia fue un reto técnico enorme para una empresa de tamaño medio como la nuestra. Pero nos demostró algo relevante: no hace falta ser un gigante de Silicon Valley para experimentar con la inteligencia artificial conversacional.

Si eres desarrollador y te intriga el mundo de los voicebots, mi consejo es simple: empieza pequeño, itera rápido y diseña siempre pensando en la persona al otro lado.

Desde Q2BSTUDIO, empresa de desarrollo de software y aplicaciones a medida, compartimos este aprendizaje porque ayudamos a compañías a crear asistentes conversacionales y agentes IA que generan impacto real. Diseñamos inteligencia artificial para empresas alineada con objetivos de negocio, construimos software y aplicaciones a medida, y ofrecemos servicios integrales en ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio y power bi, así como automatización de procesos y orquestación de datos. Si buscas un partner para lanzar tu voicebot o evolucionar tu plataforma conversacional, hablemos y llevemos tu proyecto de idea a producción con calidad, seguridad y escalabilidad.

Fin del artículo, inicio de la diversión
Construyendo software juntos

Dando vida a tus ideas desde 2008

Diseñamos aplicaciones móviles y de escritorio innovadoras que cumplen con tus requisitos específicos y mejoran la eficiencia operativa.
Más info
Cuéntanos tu visión
Sea cual sea el alcance, podemos convertir tu idea en realidad. Envíanosla y charlemos sobre tu proyecto o una colaboración futura.
Contáctanos
artículos destacados
Live Chat
Enviado correctamente.

Gracias por confiar en Q2BStudio