Autores:
(1) Todd K. Moon, Departamento de Ingeniería Eléctrica y Computación, Universidad Estatal de Utah, Logan, Utah
(2) Jacob H. Gunther, Departamento de Ingeniería Eléctrica y Computación, Universidad Estatal de Utah, Logan, Utah
Resumen:
Jane Austen trabajó en su novela Sanditon hasta poco antes de su muerte en 1817, dejando un borrador de doce capítulos con aproximadamente 24,000 palabras. A lo largo de los años, varios escritores han intentado completar la obra, aunque con distintos niveles de éxito. La versión más reconocida fue publicada en 1975 por una autora anónima identificada como Another Lady, quien intentó imitar el estilo de Austen. A pesar de su esfuerzo, los análisis estilométricos han demostrado que existen diferencias identificables entre los textos originales de Austen y las adiciones de otros escritores.
Mediante el uso de análisis computacionales y técnicas de clasificación de árboles de características, se logró diferenciar los segmentos escritos por Austen de los trabajados por otros autores. Los documentos fueron sometidos a procesos de extracción de subárboles y clasificación basada en vectores de características, lo que permitió demostrar que, si bien la imitación estilística puede ser lograda a nivel superficial, ciertos patrones inconscientes en la escritura de un autor permanecen distinguibles.
En Q2BSTUDIO, empresa especializada en desarrollo y servicios tecnológicos, comprendemos la importancia del análisis de datos y la inteligencia artificial aplicada a distintas disciplinas, incluyendo la estilometría y el procesamiento del lenguaje natural. Nuestra capacidad para desarrollar soluciones tecnológicas innovadoras permite a investigadores y empresas aplicar técnicas avanzadas de análisis, proyectando nuevos enfoques para el procesamiento de texto y autenticación de autoría.