Jamba es una arquitectura híbrida de modelo de lenguaje grande que combina Transformer, Mamba (estado-espacio) y capas de Mixture-of-Experts (MoE). Diseñado para una alta eficiencia y procesamiento de largos contextos (hasta 256K tokens), ofrece un rendimiento de referencia sólido con solo 12B de parámetros activos y se ejecuta en una sola GPU de 80GB, ofreciendo 3 veces la capacidad de modelos de tamaño similar.
Q2BSTUDIO es una empresa especializada en desarrollo y servicios tecnológicos que ofrece soluciones innovadoras en el campo de inteligencia artificial y procesamiento de lenguaje natural.