Un nuevo artículo dirigido por el Knowledge Lab ofrece una medida diferente de los influencers en el ámbito académico. Crédito:Universidad de Chicago
Por siglos, científicos y académicos han medido la influencia de individuos y descubrimientos a través de citas, una estadística cruda sujeta a sesgos, política y otras distorsiones. Un nuevo artículo dirigido por el Knowledge Lab de la Universidad de Chicago describe una forma diferente de llevar la puntuación en ciencia:una medida más directa de cómo las ideas influyentes se propagan a través de la academia y la cultura.
El modelo computacional pone el foco en el trabajo que cambió el camino de la ciencia, pero que sigue siendo subestimado. El mismo enfoque también se puede adaptar para rastrear la influencia en otras áreas donde no existe una cultura de citación, como la literatura o la música, dijeron los autores del artículo publicado la semana pasada en procedimientos de la Academia Nacional de Ciencias .
"Estamos midiendo cuánto influyen los escritos de científicos y académicos en la discusión de ideas en el futuro, "dijo James Evans, director de Knowledge Lab y profesor de sociología en UChicago. "La influencia es un proceso politizado; aquellos que obtienen la influencia, obtener el crédito, y aquellos que obtienen el crédito obtienen el capital para hacer la próxima gran cosa. Esta es la primera vez que tenemos una mayor capacidad para identificar la influencia, y también para diagnosticar influencias sociales y estratégicas en la citación del comportamiento ".
El nuevo artículo complementa la investigación previa del Knowledge Lab utilizando enfoques de aprendizaje computacional y automático en colecciones masivas de texto, subsidios, críticas, citas y datos científicos para estudiar cómo se forman los descubrimientos, evolucionar y ser ampliamente aceptado. Su trabajo apareció recientemente en una reseña de la revista. Ciencias , coautor de Evans, que describía cómo los métodos basados en datos han profundizado la comprensión del proceso científico y ofrecido nuevos conocimientos sobre cómo realizar descubrimientos importantes en el futuro de manera más eficiente.
Yendo más allá de las citas
En teoria, Las referencias en un artículo académico permiten a los autores dar crédito a sus predecesores, los investigadores y el trabajo sobre el que construyeron su nuevo descubrimiento. Pero en la práctica las citas se eligen por muchas razones:es más probable que los autores se citen a sí mismos, poderosos colegas en su campo e investigadores de prestigiosas instituciones, ya menudo se inclinan a citar artículos más recientes o ya muy citados.
A pesar de estas imperfecciones, muchos estudios computacionales de influencia científica han utilizado el registro de citas como un sustituto útil. El nuevo estudio, dirigido por el ex investigador postdoctoral del Knowledge Lab Aaron Gerow, demuestra una novela, enfoque más profundo, utilizando tanto el texto completo de los artículos como información externa, como la identidad del autor, afiliación y reputación de la revista.
Utilizando un método computacional conocido como modelado de temas, inventado por el coautor David Blei de la Universidad de Columbia, el modelo rastrea la "influencia discursiva, "o palabras y frases recurrentes a través de textos históricos que miden cómo los académicos realmente hablan sobre un campo, en lugar de solo sus atribuciones. Para determinar la influencia de un artículo determinado, los investigadores podrían eliminarlo estadísticamente de la historia y ver cómo se habría desarrollado el discurso científico sin su contribución.
"No solo podemos descubrir cómo cambiaron los temas a lo largo del tiempo, sino que también podemos simular el futuro sin un documento determinado del pasado, y observe cómo el discurso que avanza fue diferente con y sin un documento determinado, "dijo Gerow, ahora profesor asistente en Goldsmiths, Universidad de londres. "Las citas son un tipo de impacto, y la influencia discursiva es de otro tipo. Ninguno es la historia completa, pero trabajan juntos para dar una mejor imagen de lo que está influyendo en la ciencia ".
Entrenando el modelo en colecciones de texto masivas de lingüística computacional, física, y en ciencia y erudición (JSTOR), los autores cuantifican varios sesgos y disciernen distintos patrones de influencia. Los científicos que publicaban de manera persistente en un solo campo tenían más probabilidades de ser "canonizados" de una manera que obligaba a otros a citarlos de manera desproporcionada con respecto a las contribuciones discursivas de sus artículos. Por otra parte, Los descubrimientos que cruzaron los límites disciplinarios tenían más probabilidades de tener un impacto discursivo descomunal pero menos citas, probablemente porque el "dueño" de la idea y sus aliados permanecen social e institucionalmente distantes del autor que la cita.
Bellezas durmientes y influencers desconocidos
Una subcategoría interesante de papel que detectó el modelo se conoce como "bellezas durmientes, "o artículos que pasaron relativamente desapercibidos durante años o incluso décadas antes de experimentar una ráfaga tardía de citas. Por ejemplo, un artículo de 1947 sobre el grafeno permaneció oscuro y olvidado hasta la década de 1990 con un resurgimiento del interés por la investigación en el material y un eventual Premio Nobel.
"Los periódicos tienen un ciclo de noticias, cuando mucha gente habla sobre ellos y los cita, y luego ya no son noticias nuevas, ", Dijo Evans." Nuestro modelo muestra que algunos artículos tienen mucha más influencia de la que suelen demostrar las citas, como estas 'bellezas durmientes, 'que no tuvo mucha influencia al principio, pero llegó a ser apreciado e importante más tarde ".
El mismo modelo también se puede utilizar para rastrear la influencia en otras áreas, como la literatura y la música, dijeron los autores. Texto de poemas o letras de canciones, e incluso características extratextuales como la estructura de estrofa o progresiones de acordes, podría incorporarse al modelo para encontrar personas influyentes poco reconocidas y mapear la difusión de nuevos conceptos e innovaciones.
"Hay una enorme cantidad de cultura literaria que acaba influyendo en todo tipo de cosas, pero que simplemente no tiene una tecnología de referencia similar a las citas, ", Dijo Evans." Aunque desarrollamos y validamos este modelo en texto científico, ahora podemos usarlo para cualquier cosa y para todo, especialmente los casos en los que no hay rastros de influencia sino patrones en el contenido mismo. Es como estar de moda en Twitter pero donde todo es Twitter. Eso es lo que más me emociona ".