Evaluar la transparencia de los modelos de inteligencia artificial es crucial, pero benchmarks como ROAR pueden inducir a error si se interpretan sin contexto. Este artículo analiza los sesgos inherentes a las métricas de remoción y reentrenamiento, revelando cómo la falta de información real puede disfrazarse de mejora. Desde la perspectiva de Q2BSTUDIO, empresa especializada en ia para empresas y aplicaciones a medida, se ofrecen claves para diseñar evaluaciones más robustas, integrando servicios cloud aws y azure, agentes IA, power bi y ciberseguridad. Un enfoque práctico que combina sofisticación técnica y negocio real.