POLITICA DE COOKIES

Q2BSTUDIO.COM utiliza cookies técnicas, analíticas, de sesión y de publicidad con la finalidad de prestar un mejor servicio. No obstante, necesitamos su consentimiento explícito para poder utilizarlas. Así mismo puede cambiar la configuración de las cookies u obtener más información aquí .

Contacto ¡ Te esperamos !

Blog Software Actualidad

Studio Más sobre Q2B

Proyectos ¿ Que Hemos Hecho ?

Servicios ¿ Que Hacemos ?

Contacto ¡ Te esperamos !

Proyectos ¿ Que Hemos Hecho ?

Servicios ¿ Que Hacemos ?

Blog Software Actualidad

Studio Más sobre Q2B

Volver

Liquid AI lanza LFM2.5-8B-A1B: un modelo MoE en dispositivo con 8.3B total y 1.5B de parámetros activos

Liquid AI lanza LFM2.5-8B-A1B: modelo MoE con 8.3B total y 1.5B activos

Publicado el 29/05/2026

La llegada de modelos de lenguaje eficientes capaces de ejecutarse directamente en dispositivos locales marca un punto de inflexión en la estrategia de despliegue de inteligencia artificial para empresas. La arquitectura de mezcla de expertos, conocida como MoE, permite que un modelo con miles de millones de parámetros totales active solo una fracción de ellos por cada token procesado, lo que reduce drásticamente el coste computacional sin sacrificar capacidades clave como el seguimiento de instrucciones o la llamada a herramientas. En este contexto, el reciente lanzamiento de un modelo con 8.3 mil millones de parámetros totales y solo 1.5 mil millones activos por token representa un avance significativo para entornos donde el hardware es limitado, como ordenadores portátiles, servidores edge o incluso dispositivos móviles. Este tipo de innovación abre la puerta a que las organizaciones implementen agentes IA locales que manejen información sensible sin depender de conexiones externas, lo que resulta especialmente relevante en sectores con estrictos requisitos de ciberseguridad y privacidad de datos. En nuestra práctica de inteligencia artificial trabajamos precisamente en la integración de modelos eficientes en flujos de trabajo empresariales, combinando el potencial de la IA generativa con infraestructuras que respetan la soberanía de los datos.

La capacidad de operar con solo 1.5 mil millones de parámetros activos por token implica que cada solicitud de inferencia consume menos memoria y ciclos de procesamiento, lo que permite que dispositivos con recursos modestos ofrezcan respuestas rápidas y razonadas. Este modelo en concreto incorpora una ventana de contexto de 128 mil tokens, soporte multilingüe y un mecanismo de razonamiento explícito que genera una cadena de pensamiento antes de emitir la respuesta final. Esta aproximación es especialmente valiosa para aplicaciones que requieren precisión en tareas de llamada a funciones, asistentes virtuales o automatización de procesos complejos. Las empresas que buscan desarrollar aplicaciones a medida sobre esta base pueden beneficiarse de una latencia reducida y de la posibilidad de ejecutar cargas de trabajo de IA sin conexión permanente a la nube, lo que optimiza costes operativos y reduce la dependencia de servicios cloud aws y azure para procesos críticos en tiempo real. Cuando una organización necesita combinar estas capacidades con dashboards interactivos o reportes avanzados, la integración con servicios inteligencia de negocio como power bi permite cerrar el círculo entre la inferencia local y la visualización estratégica de datos.

El entrenamiento de este tipo de modelos requiere técnicas específicas para evitar bucles de razonamiento infinitos y alucinaciones, algo que los desarrolladores han abordado mediante fases de aprendizaje por refuerzo con recompensas diseñadas para fomentar la abstención cuando el conocimiento no es fiable. Para una empresa de desarrollo de software como Q2BSTUDIO, la posibilidad de ofrecer soluciones basadas en modelos abiertos y ligeros supone una ventaja competitiva a la hora de diseñar sistemas de agentes IA que operen en entornos controlados, como fábricas, hospitales o instituciones financieras. La versatilidad del modelo para ejecutarse tanto en CPU como en GPU con rendimientos notables —más de 250 tokens por segundo en un chip avanzado— lo convierte en un candidato ideal para integrarse en plataformas de software a medida donde la personalización y la eficiencia son requisitos fundamentales. Además, su compatibilidad con marcos de inferencia estándar facilita el despliegue sin necesidad de reescribir pilas tecnológicas existentes.

La evolución hacia modelos que puedan operar en dispositivos sin conexión a internet no solo democratiza el acceso a la inteligencia artificial, sino que también redefine los límites de lo que es posible en términos de privacidad y velocidad de respuesta. Las organizaciones que apuestan por esta dirección pueden construir asistentes internos que procesen documentos extensos, ejecuten herramientas externas mediante llamadas a funciones y mantengan un control total sobre los datos, algo que resulta crítico en sectores regulados. Desde nuestra perspectiva como empresa tecnológica, la convergencia entre modelos MoE eficientes y las necesidades reales del negocio representa una oportunidad para repensar la arquitectura de los sistemas de información, integrando inteligencia artificial, ciberseguridad y cloud computing en un ecosistema coherente y escalable. La adopción de estas tecnologías, cuando se apoya en un equipo con experiencia en desarrollo de aplicaciones empresariales, permite transformar conceptos innovadores en herramientas productivas que generan valor tangible.

Fin del artículo, inicio de la diversión

Usa solo las flechas

Score

Game Over

Play Again

¿cómo podemos ayudarte?

APP

Business Intelligence

ecommerce

Process Automation

Construyendo software juntos