IA en el navegador con onnxruntime web si es posible
La mayoría de los modelos de machine learning viven en el backend, lo que obliga a hacer llamadas a servidor en cada predicción. Sin embargo, ejecutar el modelo directamente en el navegador aporta velocidad, privacidad y menos infraestructura. Eso es exactamente lo que logramos con la librería onnxruntime web, que aprovecha WebAssembly y WebGL para acelerar la inferencia en el cliente.
A continuación te explico cómo llevar un modelo ONNX al frontend y ejecutarlo en el navegador con un flujo claro: 1 preparar los datos de entrada con las mismas características que se usaron en el entrenamiento 2 codificar y formatear las variables tal y como se hizo al entrenar 3 cargar el modelo ONNX en el navegador con onnxruntime web 4 ejecutar la inferencia y mostrar el resultado al usuario.
Requisitos y configuración básica: conocimientos de Python para entrenar y exportar el modelo, conocimientos básicos de ML para preparar características y exportar a ONNX, conocimientos de JavaScript para el cliente, un entorno frontend como HTML plano o frameworks como React o Next.js, y el archivo ONNX exportado. Coloca el modelo en la carpeta pública del proyecto y agrega la dependencia onnxruntime web. Con eso ya podrás crear una sesión de inferencia en el navegador.
Preparación de datos para inferencia: el nuevo input debe coincidir con el entrenamiento en formato, codificación y orden. Reúne exactamente las mismas variables, por ejemplo edad, genero, family history, work interfere, no employees, remote work, leave y otras categóricas. Codifica del mismo modo que en entrenamiento empleando codificación binaria para sí o no, ordinal para categorías con rango como muy fácil a muy difícil, y one hot para variables con varios estados. Verifica que el número y el orden de las características coincidan al milímetro. Un ejemplo típico sería trabajar con 21 características finales ya transformadas.
Codificación de la entrada en el cliente: mapea cada opción del formulario del usuario a su valor numérico. Por ejemplo sí 1 y no 0 para binarios, un rango de 0 a 4 para opciones ordinales como facilidad para pedir un permiso, y vectores one hot para atributos como genero u opciones de beneficios. Normaliza valores numéricos como edad y aplica valores por defecto prudentes cuando el usuario no selecciona algo. El objetivo es construir un arreglo ordenado con float32 de tamaño 1 por n características.
Carga del modelo e inferencia en el navegador: crea una sesión con onnxruntime web y construye un tensor float32 con forma 1 por numero de características. Asegúrate de usar el nombre de entrada que quedó en el exportado ONNX por ejemplo float input. Ejecuta session run con ese feed y recupera las salidas definidas en tu grafo, que a menudo son un índice de clase y un vector de probabilidades. Mapea el índice a tus etiquetas humanas como No Treatment y Needs Treatment y muestra los porcentajes al usuario.
Ejemplo de resultado interpretado: clase predicha No Treatment con probabilidad 0.9707 y Needs Treatment con 0.0293. La visualización puede incluir mensajes claros, barras de confianza y recomendaciones de siguiente paso según el caso de uso, manteniendo siempre la privacidad del usuario porque todo el cálculo se hace en su dispositivo.
Beneficios de ejecutar modelos en el navegador con onnxruntime web: predicciones más rápidas al evitar idas y vueltas al backend, máxima privacidad ya que los datos no salen del equipo del usuario, y gran accesibilidad porque solo se necesita un navegador moderno. Además, reduce costes de infraestructura y simplifica el escalado de aplicaciones a medida.
En Q2BSTUDIO somos expertos en llevar inteligencia artificial al frontend y backend con prácticas robustas de ingeniería, creando software a medida y aplicaciones a medida que integran modelos ONNX, agentes IA y analítica avanzada. Si buscas una consultora que diseñe e integre soluciones de ia para empresas con foco en rendimiento, seguridad y experiencia de usuario, descubre nuestros servicios de inteligencia artificial y nuestra oferta de aplicaciones y software a medida.
Nuestro equipo también te ayuda a desplegar soluciones en la nube con servicios cloud aws y azure, a proteger tus sistemas con ciberseguridad y pentesting, y a transformar datos en decisiones con servicios inteligencia de negocio y power bi. Integramos pipelines MLOps, automatización de procesos, monitorización de inferencias y modelos con baja latencia en el edge. Contáctanos y llevemos tu siguiente proyecto de IA en el navegador desde la idea hasta producción de forma segura, escalable y rentable.