
La investigación fue publicado en Science Advances y está provocando un interesante debate en el mundo de la ciencia. Escrito por Dmitry Kobak, de la Universidad de Tubinga (Alemania), junto a otros colegas, rastrea el papel que juega hoy la IA en la redacción de papers científicos.
Tomando como antecedente un estudios que ellos mismos hicieron durante la época del Covid, que había mostrado cambios en el vocabulario de los papers inducidos por la pandemia, ahora salieron a ver cómo están impactando los grandes modelos de lenguaje (LLM) de los chatbots de IA .
Para eso analizaron más de 15 millones de “abstracts” (resúmenes) de papers indexados, entre 2010 y 2024, en PubMed, la base de datos de investigaciones biomédicas más grande del mundo. ChatGPT fue liberado al público en noviembre de 2022.
Lo que hallaron fue un aumento enorme del uso de ciertas palabras, a partir de 2023 . Ya no términos técnicos, como en la pandemia. Ahora, verbos y adjetivos típicos de los LLM, como “indagar”, “profundizar”, “crucial”, o “significativo”. En total, 454 palabras mostraron un uso excesivo, contra 190 en el pico pandémico.
Según el análisis que hicieron, al menos el 13,5% de los abstracts de 2024 fueron redactados con ayuda de IA. Eso equivale a más de 200.000 papers al año.
Encontraron diferencias importantes. Donde más se usa la IA es en papers de bioinformática, de países como China y Corea del Sur y en revistas de menos prestigio. En esos casos, la tasa llega al 40%. En cambio, en países de habla inglesa y revistas prestigiosas (como Science y Nature) cae al 5%.
Los autores debaten la cuestión. Señalan que la escritura asistida por LLM puede “democratizar” los papers, al facilitar la traducción al inglés, mejorar la gramática y darle velocidad al proceso de escritura. Recordemos que los papers tienen que ser escritos en inglés, por investigadores de todo el mundo.
Pero advierten por los riesgos: información inexacta, sesgos, plagio, y sobre todo, homogeneización del pensamiento. “Todas las introducciones generadas por LLM sobre un tema determinado podrían sonar igual y contener el mismo conjunto de ideas y referencias, perdiendo así innovaciones y exacerbando la injusticia en las citas”, señalan.
El trabajo es, además, un llamado de atención para la producción cultural en general. Porque, ¿cuánto de LLM tendrán ya hoy los libros de texto, la literatura, la música o las películas? ¿Qué encontraríamos si le pasamos la matriz de Kobak?
Efectivamente, la IA puede democratizar el acceso a la ciencia. También potenciar la creación, si es bien usada. Pero abre interrogantes sobre cuánto podemos perder en cuanto a capacidades de expresión y de diversidad de ideas si delegamos la creación en la máquina y el pensamiento se vuelve más homogéneo.
Un tema a seguir con atención, porque esta historia recién comienza.