Alessia Iancarelli, estudiante de doctorado en el laboratorio de Ciencias Afectivas y Cerebrales de Northeastern. Crédito:Alyssa Stone/Universidad del Noreste
Si quieres ser científico, tendrás que leer mucho.
La ciencia es un esfuerzo centrado en la construcción y el intercambio de conocimientos. Los investigadores publican artículos que detallan sus descubrimientos, avances e innovaciones para compartir esas revelaciones con sus colegas. Y hay millones de artículos científicos cada año.
Mantenerse al día con los últimos desarrollos en su campo es un desafío para los investigadores en todos los puntos de sus carreras, pero afecta especialmente a los científicos principiantes, ya que también tienen que leer los muchos artículos que representan la base de su campo.
"Es imposible leer todo. Absolutamente imposible", Ajay Satpute, director del Laboratorio de Ciencias Afectivas y Cerebrales y profesor asistente de psicología en Northeastern. "Y si no sabes todo lo que ha sucedido en el campo, existe una posibilidad real de reinventar la rueda una y otra y otra vez". El desafío, dice, es descubrir cómo capacitar económicamente a la próxima generación de científicos, equilibrando la necesidad de leer todos los artículos fundamentales con la capacitación como investigadores por derecho propio.
Esa tarea se está volviendo cada vez más difícil, dice Alessia Iancarelli, estudiante de doctorado que estudia psicología afectiva y social en el laboratorio de Satpute. "El volumen de literatura publicada sigue aumentando", dice ella. "¿Cómo pueden los científicos desarrollar su erudición en un campo dada esta enorme cantidad de literatura?" Tienen que escoger y elegir qué leer.
Pero los enfoques comunes para esa priorización, dice Iancarelli, pueden incorporar sesgos y dejar de lado rincones cruciales del campo. Entonces, Iancarelli, Satpute y sus colegas desarrollaron un enfoque de aprendizaje automático para encontrar una forma mejor y menos sesgada de hacer una lista de lectura. Sus resultados, que se publicaron la semana pasada en la revista PLOS One , también ayuda a reducir el sesgo de género.
"Realmente hay un problema sobre cómo desarrollamos la erudición", dice Satpute. En este momento, los científicos a menudo usan una herramienta de búsqueda como Google Scholar sobre un tema y comienzan desde allí, dice. "O, si tiene suerte, obtendrá un instructor maravilloso y tendrá un gran programa de estudios. Pero ese será básicamente el campo a través de los ojos de esa persona. Y creo que esto realmente llena un nicho que podría ayudar a crear equilibrio y una erudición interdisciplinaria sin tener necesariamente acceso a un instructor maravilloso, porque no todos obtienen eso".
El problema con algo como Google Scholar, explica Iancarelli, es que te dará los artículos más populares en un campo, medido por cuántos otros artículos los han citado. Si hay subconjuntos de ese campo que no son tan populares pero que aún son relevantes, los documentos importantes sobre esos temas podrían perderse con dicha búsqueda.
Tomemos, por ejemplo, el tema de la agresión (que es el tema en el que los investigadores se centraron para desarrollar su algoritmo). Los medios y los videojuegos son un tema particularmente candente en la investigación de la agresión, dice Iancarelli, y por lo tanto hay muchos más artículos sobre ese subconjunto del campo que sobre otros temas, como el papel de la testosterona y la agresión social.
Entonces Iancarelli decidió agrupar los artículos sobre el tema de la agresión en comunidades. Utilizando el análisis de redes de citas, identificó 15 comunidades de investigación sobre agresión. En lugar de observar la cantidad bruta de veces que un artículo ha sido citado en otro artículo de investigación, el algoritmo determina una comunidad de artículos que tienden a citarse entre sí o al mismo conjunto central de artículos. Las comunidades más grandes que reveló fueron los medios y los videojuegos, el estrés, los rasgos y la agresión, la rumiación y la agresión desplazada, el papel de la testosterona y la agresión social. Pero también hubo algunas sorpresas, como una comunidad más pequeña de trabajos de investigación centrados en la agresión y los caballos.
"Si usa la detección de la comunidad, entonces obtiene esta mirada granular realmente rica en el campo de agresión", dice Satpute. "Tienes una especie de vista panorámica de todo el campo en lugar de que [pareciera que] el campo de la agresión son básicamente los medios, los videojuegos y la violencia".
Además de diversificar los temas presentados mediante el uso de este enfoque comunitario, los investigadores también encontraron que el porcentaje de artículos con primeras autoras calificadas como influyentes por el algoritmo se duplicó en comparación con cuando se centraron solo en el recuento total de citas. (Iancarelli agrega que podría haber algunos sesgos en ese resultado, ya que el equipo no pudo preguntar a los autores directamente sobre su identidad de género y, en cambio, tuvo que confiar en suposiciones basadas en el nombre del autor, la imagen y los pronombres utilizados para referirse a ellos. .)
El equipo ha publicado el código detrás de este algoritmo para que otros puedan usarlo y replicar su enfoque de análisis de red de citas en otros campos de investigación.
Para Iancarelli, hay otra motivación:"Me encantaría usar este trabajo para crear un programa de estudios e impartir mi propio curso sobre agresión humana. Realmente me encantaría basar el programa de estudios en los documentos más relevantes de cada comunidad diferente para dar una verdadera visión general". vista del campo de agresión humana".