SAM 3 ya está aquí y no es una simple mejora incremental: es un salto hacia una segmentación multimodal que entiende el lenguaje y percibe objetos en 2D, video y 3D. Meta publicó SAM 3 en noviembre de 2025 y, según la documentación oficial y las demos, las tres novedades centrales son la segmentación por vocabulario abierto, la unificación de imágenes, vídeo y reconstrucción 3D, y mejoras importantes en eficiencia de inferencia.
La gran novedad de SAM 3 es que ahora se le puede indicar con texto qué queremos segmentar. En lugar del clásico flujo click to segment, bastan descripciones como rojo coche o autobús escolar amarillo para que el modelo detecte, segmente y siga esos objetos a lo largo de frames. Eso convierte tareas que antes requerían recolectar y etiquetar grandes datasets y entrenar modelos dedicados en procesos de tipo zero shot mediante prompts de texto.
Además SAM 3 utiliza un backbone visual compartido que mantiene coherencia temporal en vídeo y ofrece capacidad de estimación 3D, lo que abre posibilidades reales para XR, robótica y pipelines de visión para empresas. A pesar de su potencia, Meta ha trabajado en optimizaciones para mantener la eficiencia y facilitar el despliegue en dispositivos de borde.
Desde la perspectiva de startups y equipos de I+D esto cambia las reglas del juego. Funciones como detección por descripción permiten pasar de pruebas de concepto a prototipos funcionales en días en lugar de meses, reduciendo la necesidad de datos etiquetados y acelerando el time to market para soluciones industriales, agrícolas o de inspección visual.
En nuestro laboratorio en Q2BSTUDIO ya hemos probado una implementación local de SAM 3 para evaluar rendimiento, seguridad y latencia. Ejecutarlo on premises es clave cuando se prioriza privacidad y control sobre los datos; por eso, en proyectos reales solemos combinar modelos avanzados con arquitectura local y soluciones de integración con cámaras y dispositivos IoT para casos de uso de segmentación en tiempo real.
En la prueba utilizamos un equipo con AMD Ryzen AI Max+ 395, CPU 16 núcleos Zen 5, 128 GB LPDDR5x y hasta 126 TOPS en cargas combinadas. Gracias a la arquitectura de memoria unificada pudimos ejecutar inferencias locales de forma fluida sin enviar datos a la nube, aunque para algunos escenarios de alto rendimiento una GPU dedicada sigue siendo la opción más eficiente.
Q2BSTUDIO es una empresa especializada en desarrollo de software y aplicaciones a medida que integra soluciones de inteligencia artificial, ciberseguridad y servicios cloud para empresas. Ofrecemos desde software a medida y aplicaciones a medida hasta consultoría en inteligencia artificial para empresas y despliegues gestionados en servicios cloud aws y azure. Si buscas integrar SAM 3 en un flujo productivo, modernizar procesos con agentes IA o construir tableros con power bi para explotar datos segmentados, nuestro equipo puede acompañarte en todo el ciclo de adopción.
En Q2BSTUDIO diseñamos arquitecturas seguras y escalables que combinan automatización, inteligencia de negocio y protección mediante prácticas de ciberseguridad y pentesting. Para proyectos que requieren soluciones de IA a medida puedes consultar nuestra oferta de inteligencia artificial en servicios de inteligencia artificial para empresas y si tu prioridad es crear aplicaciones o software a medida revisa nuestras opciones en desarrollo de aplicaciones y software multiplataforma.
Conclusión: SAM 3 sitúa la visión por computador en una fase de comprensión real, donde lenguaje y visión confluyen para ofrecer herramientas más versátiles y productivas. Para empresas que necesitan acelerar proyectos de visión, reducir costes de etiquetado y desplegar soluciones seguras, esta generación de modelos representa una oportunidad estratégica que desde Q2BSTUDIO sabemos convertir en soluciones aplicadas y escalables.
Si quieres explorar cómo incorporar SAM 3 en tus procesos industriales, agrícolas o de negocio, optimizar flujos con agentes IA, o montar pipelines seguros en la nube y en local, ponte en contacto con nosotros y diseñamos la solución a medida que mejor encaje con tus objetivos.