Una nueva herramienta de inteligencia artificial creada para ayudar a identificar ciertos tipos de abuso de sustancias basada en las publicaciones de Facebook de un joven sin hogar podría proporcionar a los refugios para personas sin hogar información vital para incorporar en el plan de gestión de casos de cada individuo. Crédito:CC0 Public Domain
Parece que la Navidad llega temprano este año para los científicos sociales.
Eso es porque, solo unos meses después de que el profesor de la Universidad Albert J. Weatherhead III, Gary King, escribiera un artículo académico sobre un sistema que permitiría a los investigadores acceder a los enormes tesoros de datos en poder de Facebook y otras empresas privadas, está destinado a convertirse en una realidad.
Junto con su colaborador Nathaniel Persily en Stanford, King creó una organización llamada Social Science One que liderará el esfuerzo por identificar datos dentro de Facebook, prepáralo para los investigadores, y financiar a numerosos académicos para analizar los datos.
La organización está haciendo hoy el primero de lo que King dice que serán muchos conjuntos de datos disponibles para la investigación:un tesoro masivo de más de medio billón de números que incluye todos los enlaces en los que los usuarios de Facebook hicieron clic en el último año. incluidos los tipos de personas que hicieron clic, en qué hicieron clic, e indicadores para determinar si los enlaces se consideraron noticias intencionalmente falsas.
"Como científicos sociales, nuestro objetivo es comprender y resolver los mayores desafíos que afectan a la sociedad humana, "King dijo." Hace veinte años, Casi todos los datos del mundo para abordar estos desafíos fueron creados por aquellos de nosotros en la academia, por los gobiernos y entregado a nosotros, o por empresas privadas y vendidos a nosotros, ", dijo." Pero el problema es que, aunque tenemos más datos que nunca, tenemos una fracción más pequeña de los datos que el mundo está creando. La mayoría de los datos que serían útiles para las ciencias sociales ahora se encuentran encerrados en empresas privadas. Social Science One es un mecanismo importante para desbloquear esos datos para los científicos sociales ".
Y la cantidad de datos a la que tendrán acceso es casi inimaginable.
"Los datos a los que vamos a proporcionar acceso son extraordinarios; en cantidad, pueden rivalizar con la cantidad total de datos que existen actualmente en las ciencias sociales".
"Esta comisión tiene el potencial de abrir un nuevo capítulo en la investigación de las ciencias sociales, y en la adquisición general de conocimientos, en el que las organizaciones que poseen información de importancia crítica sobre personas e instituciones, como plataformas de redes sociales, y los investigadores profesionales podrán colaborar de manera más eficaz para abordar algunos de los problemas más difíciles que enfrenta nuestra sociedad, "dijo Matthew Baum, Profesor Marvin Kalb de Comunicaciones Globales en la Escuela Kennedy de Harvard, y miembro de la comisión Social Science One.
Esbozado por King y Persily en un documento de trabajo en abril, el marco que sustenta la Ciencia Social Uno consta de dos partes.
El primero, él dijo, es una comisión de académicos distinguidos de todo el mundo que trabajará con funcionarios de Facebook para identificar conjuntos de datos potenciales que pondrán a disposición de los investigadores a través de un proceso en el que se envían propuestas de estudio y se revisan por pares. Una vez aprobadas las ideas del estudio, los investigadores obtienen acceso a los datos, así como a subvenciones para apoyar su trabajo proporcionadas por siete fundaciones benéficas. Las fundaciones abarcan toda la gama ideológica, pero su dinero está mancomunado, y todas las decisiones serán tomadas por académicos, y por eso ningún punto de vista puede dominar. Y los investigadores externos tendrán total libertad académica sin tener que otorgar derechos de aprobación previa a la publicación de Facebook.
"La parte clave del proceso es que la comisión, como tercero de confianza, puede examinar las propuestas y decidir que algunas no sean financiadas, incluso si son científicamente apropiadas, por razones que no se conocen públicamente, como si se refirieran a un litigio que no se ha hecho público, ", continuó." Y si Facebook incumple este acuerdo y no pone a disposición los datos que Social Science One solicita, estamos obligados a informar de ello al público. Entonces, este sistema es compatible con incentivos para el público, para la compañía, y para la comunidad científica social. Pensamos en esto como esencialmente un trabajo de ciencia política, donde se nos ocurrió una constitución que funciona para todos los partidos ".
Social Science One se está incubando en el Instituto de Ciencias Sociales Cuantitativas de Harvard, que dirige King. A través de los años, IQSS ha asumido este tipo de actividad muchas veces. Regularmente ha incubado y escindido grupos de investigación sin fines de lucro y empresas con fines de lucro, así como centros, programas, y proyectos de investigación ahora alojados en IQSS, en otra parte de Harvard, y en otras instituciones.
Por muy emocionante que sea para los investigadores tener acceso al almacén de datos de Facebook, el uso (y mal uso) de los datos de Facebook ha sido noticia en todo el mundo en los últimos meses, algo que King y sus colegas han desarrollado procedimientos para evitar. Incorporaron salvaguardias en sus procedimientos, el primero de los cuales es simple:los investigadores no recibirán datos de Facebook, solo se les dará acceso a él.
"No se entregarán datos académicos, como antes, "King dijo". pondremos el acceso a los datos a disposición de los académicos para que siempre se preserve la privacidad individual ".
Además, la organización planea hacer uso de un concepto matemático conocido como "privacidad diferencial, "para garantizar que los datos que están disponibles no puedan rastrearse hasta usuarios individuales". Tenemos algunos de los principales expertos del mundo estudiando este concepto aquí en Harvard, incluida Cynthia Dwork, el profesor Gordon McKay de Ciencias de la Computación en la Escuela de Ingeniería y Ciencias Aplicadas John A. Paulson de Harvard, y Salil Vadhan, la profesora Vicky Joseph de Ciencias de la Computación y Matemática Aplicada, ambos son miembros de la comisión, ", Dijo King." La idea es que puede tomar un conjunto de datos y agregar tipos especiales de ruido aleatorio para que sea imposible identificar a una sola persona, pero cuando lo agregas, no altera los patrones generales que desea examinar ".
Pero, con mucho, la medida de seguridad más sólida, King dijo, está relacionado con el sistema que permite a los académicos acceder a los datos. "Cuando los académicos acceden a los datos, cada carácter que escriban será registrado y auditado, ", dijo." Entonces, si escriben la letra 'k, 'sabremos que mecanografiaron esa carta. Por lo tanto, no hay posibilidad de que copien o hagan un mal uso de los datos. Esto significa que estamos pasando de un modelo de responsabilidad individual, que tiene al investigador violando las reglas como un único punto de falla, a uno de responsabilidad colectiva, donde nadie puede violar la privacidad sin que todos lo sepan y puedan detenerlo ".
Por último, King dijo, El objetivo de Social Science One es desarrollar formas para que Facebook, y eventualmente otras empresas, pongan sus vastos almacenes de datos a disposición de los investigadores con la esperanza de encontrar soluciones a los problemas sociales que continúan asolando a la humanidad.
"Facebook tiene datos muy informativos sobre dos mil millones de personas, ", Dijo King." Es un privilegio increíble, y el privilegio conlleva una considerable responsabilidad. Tiene sentido que Facebook también use parte de esa información y poder para ayudar al público y contribuir al bien social ".
Es una idea que tiene precedentes, King dijo.
Largo de las décadas, Varias grandes empresas han creado grandes divisiones de investigación, quizás más notablemente con la creación de Bell Labs por AT&T y Microsoft Research en Microsoft, que permitió a los científicos la libertad de explorar temas tan variados como la teoría de la información y el desarrollo de láseres y transistores.
Con el lanzamiento del primer conjunto de datos hoy, King y sus colegas esperan continuar esa tradición, pero de una manera diseñada especialmente para los negocios relacionados con las ciencias sociales.
"Este es solo nuestro primer conjunto de datos; tenemos muchos otros que vendrán después de esto, y contamos con financiación de siete generosas fundaciones, por lo que esperamos comenzar a poner a los investigadores en funcionamiento rápidamente, King dijo:"También esperamos extender esta colaboración más allá de Facebook y asociarnos con otras empresas también".
"Los descubrimientos que hacemos con estos conjuntos de datos no van a interrumpir los negocios de estas empresas, pero podrían ayudar a resolver algunos de los desafíos que afectan a la sociedad humana, "King dijo." Y si hay una manera de hacer eso, ¿Quién no querría contribuir a esa misión? "