SAFE (Search-Augmented Fact Evaluation) utiliza un modelo de lenguaje para evaluar la precisión factual de respuestas extensas. Divide las respuestas en hechos individuales, los revisa para mayor claridad y verifica su exactitud utilizando Google Search. El proceso implica varios pasos como determinar la relevancia, emitir consultas de búsqueda y clasificar los hechos como respaldados o no respaldados. Los desafíos incluyen sesgos del modelo de lenguaje y generalización variable en diferentes temas, los cuales serán abordados en trabajos futuros.
Empresa Q2BSTUDIO, empresa de desarrollo y servicios tecnológicos.