Propuesta para el Google AI Studio Multimodal Challenge
BabySafe AI es un applet web sencillo y pensado para dar tranquilidad a madres, padres y cuidadores. Resuelve el reto de adaptar la casa para un bebé con movilidad de entre 6 y 18 meses funcionando como un segundo par de ojos impulsado por IA. La experiencia es directa y rápida: subes una foto de una habitación y, con la capacidad de visión del modelo Gemini de Google, la aplicación analiza la escena, detecta riesgos domésticos habituales y los presenta en una lista clara y accionable. El objetivo es convertir una tarea estresante en una comprobación de seguridad simple y confiable.
Demostración del flujo
Carga de imagen: una interfaz limpia permite arrastrar y soltar o seleccionar una foto de la habitación. Vista previa y análisis: tras elegir la imagen, se muestra una previsualización y el usuario pulsa Analizar seguridad para iniciar el proceso. Progreso: un indicador de carga comunica que la IA está trabajando. Informe de riesgos: si se detectan peligros, los resultados se muestran con la imagen original a la izquierda y, a la derecha, una lista detallada y desplazable con cada peligro, el riesgo que representa y una descripción precisa de su ubicación dentro de la escena.
Cómo se aprovechó Google AI Studio
El núcleo usa el modelo gemini-2.5-flash de la plataforma de Google para dos capacidades multimodales clave. Comprensión visual: el modelo interpreta el contenido de la imagen con contexto de seguridad infantil, y va más allá de la simple detección de objetos. Salida estructurada en JSON: se define un prompt de sistema orientado a experto en seguridad infantil junto con un responseSchema estricto para que el resultado llegue en un formato JSON predecible. Esto permite analizar de forma confiable la respuesta y renderizar la lista de peligros en la interfaz, transformando un modelo generalista en una herramienta especializada y estable.
Funciones multimodales
Análisis de imagen a texto estructurado: el sistema convierte una entrada visual no estructurada en datos de texto accionables, por ejemplo un objeto JSON con los riesgos identificados. Esto mejora la experiencia del usuario al permitir una entrada intuitiva mediante foto, evita que la persona tenga que describir la habitación con palabras y aporta comprensión contextual de los peligros, como enchufes a baja altura, esquinas expuestas o cables colgantes. Además, las descripciones son conscientes del espacio, incluyendo una location_description como en el suelo en la esquina inferior izquierda, lo que facilita actuar de inmediato sobre cada hallazgo.
Q2BSTUDIO y soluciones de IA listas para producción
En Q2BSTUDIO desarrollamos soluciones de software a medida y aplicaciones a medida que convierten ideas como BabySafe AI en productos robustos para el mundo real. Integramos inteligencia artificial de última generación y agentes IA con buenas prácticas de ciberseguridad, despliegues escalables en servicios cloud aws y azure, y analítica avanzada con servicios inteligencia de negocio y power bi. Si tu organización busca ia para empresas, desde un piloto rápido hasta un sistema productivo de alto impacto, podemos ayudarte a diseñar, construir y mantener la solución end to end.
Descubre cómo potenciamos tus casos de uso con inteligencia artificial aplicada y cómo llevamos tus ideas a producción con aplicaciones a medida y software a medida listos para escalar.
Nota
BabySafe AI ofrece recomendaciones de apoyo y no sustituye la supervisión adulta ni las guías profesionales de seguridad infantil.