Una de las editoriales académicas más grandes del mundo vende un libro sobre la ética de la investigación en inteligencia artificial que parece estar plagado de citas falsas, incluyendo referencias a revistas inexistentes.
La publicación académica ha sido criticada recientemente por aceptar artículos fraudulentos producidos mediante IA, que han superado un proceso de revisión por pares diseñado para garantizar altos estándares.
The Times descubrió que un libro publicado recientemente por el gigante editorial germano-británico Springer Nature incluye docenas de citas que parecen haber sido inventadas, lo que a menudo indica que el material fue generado por IA.
El libro, Aspectos sociales, éticos y legales de la IA generativa, se anuncia como una revisión autorizada de los dilemas éticos que plantea esta tecnología y está a la venta por 125 libras esterlinas. Al menos dos capítulos incluyen notas a pie de página que citan publicaciones científicas que parecen haber sido inventadas.
En un capítulo, 8 de las 11 citas no pudieron verificarse, lo que sugiere que más del 70 % podrían haber sido inventadas.
Existe una creciente preocupación en el ámbito académico por la generación de citas e incluso artículos de investigación completos mediante herramientas de IA que intentan imitar trabajos académicos genuinos.
En abril, Springer Nature retiró otro título tecnológico, Mastering Machine Learning: From Basics to Advanced, tras descubrirse que contenía numerosas referencias ficticias.
En el libro más reciente analizado por The Times, una cita afirma referirse a un artículo publicado en "Harvard AI Journal". Harvard Business Review ha afirmado que dicha revista no existe.
Guillaume Cabanac, profesor asociado de informática en la Universidad de Toulouse y experto en la detección de artículos académicos falsos, analizó dos capítulos utilizando BibCheck, una herramienta diseñada para identificar referencias inventadas.
Descubrió que al menos 11 de las 21 citas del primer capítulo no se pudieron relacionar con artículos académicos conocidos. El análisis también sugirió que 8 de las 11 citas del capítulo 4 eran imposibles de rastrear.
"Esto constituye una mala conducta investigadora: falsificación e invención de referencias", declaró Cabanac. Realiza un seguimiento de estos casos y afirma haber observado un aumento constante de citas "alucinadas" de IA en la literatura académica.
Añadió: "Los investigadores construyen conocimiento basándose en investigaciones previamente publicadas... Cuando [estos estudios] son frágiles o deficientes, no podemos construir nada sólido sobre ellos".
Una revisión independiente realizada por el Dr. Nathan Camp, de la Universidad Estatal de Nuevo México, llegó a conclusiones similares. Camp, quien ha estudiado el auge de las citas falsas generadas por IA, encontró numerosas referencias erróneas, incoherentes o totalmente inventadas en el libro de ética de la IA.
En algunos casos, parecía que se habían combinado detalles de diferentes artículos auténticos. Otros seis capítulos parecían ser precisos. Cada capítulo fue escrito por un grupo diferente de autores.
Camp afirmó: «Si bien es difícil determinar con certeza si las citas utilizadas son generadas por IA, en el mejor de los casos son erróneas, probablemente inventadas, y la forma más sencilla de inventar citas es con IA».
James Finlay, vicepresidente de libros de ciencias aplicadas de Springer Nature, afirmó: «Nos tomamos muy en serio cualquier inquietud sobre la integridad de nuestro contenido publicado. Nuestro equipo especializado en integridad de la investigación está investigando este caso con prioridad».
Añadió: «Nuestro equipo de integridad trabaja con editores y utiliza conocimientos especializados y herramientas de detección para mantener nuestros estándares y detectar cualquier problema de integridad con antelación. Sin embargo, es posible que se nos escape un pequeño número».