La conferencia Dawn or Doom 2018 presenta charlas de más de tres docenas de miembros de la facultad de Purdue y expertos nacionales que representan cuatro áreas:Máquinas:inteligencia artificial, robótica, vehículos autónomos y drones; Mente:efectos de Internet y las redes sociales; Cuerpo:bioingeniería y diseño humano; y datos:Internet de las cosas, privacidad y ciberseguridad. Crédito:Universidad Purdue
"Me siento enfermo." "¡Este videojuego está ENFERMO!" A una computadora, la palabra "enfermo" puede tener el mismo significado en estas dos oraciones.
Pero un profesor de Purdue está combinando el aprendizaje automático con modelos de relaciones sociales y comportamiento para leer entre líneas de texto y capturar la intención del autor de una manera más profunda. La tecnología podría ayudar a identificar sesgos en publicaciones en redes sociales y artículos de noticias. para juzgar mejor la validez de la información.
El procesamiento tradicional del lenguaje natural implica centrarse en palabras clave, por ejemplo, la palabra "buena" normalmente indicaría una opinión positiva. Esto funciona bien para ciertas aplicaciones, pero no es útil cuando el texto es ambiguo, por ejemplo, si el autor pretendía que una palabra o frase fuera sarcástica o irónica.
Ahí es donde entra en juego el enfoque del profesor de Purdue, Dan Goldwasser. Se centra especialmente en los acontecimientos actuales y los problemas políticos, y analiza artículos de noticias y tweets de políticos para tratar de determinar cómo el autor enmarca ciertos temas y cuál es su ideología.
Goldwasser, un profesor asistente de ciencias de la computación, hablará sobre este trabajo en Dawn o Doom '18, Conferencia anual de Purdue sobre los riesgos y recompensas de las tecnologías emergentes. Dawn or Doom se llevará a cabo en el campus de West Lafayette de Purdue los lunes y martes (5-6 de noviembre). La Conferencia, ahora en su quinto año, es gratis y abierto al público.
Dawn or Doom está alineado con la Campaña Sesquicentenario Saltos Gigantes de Purdue y es parte del tema del Festival de Ideas, Saltos gigantes en inteligencia artificial, Algoritmos, y Automatización:Equilibrio entre humanidad y tecnología. El Festival de Ideas es la pieza central de la campaña y conecta a oradores de renombre mundial y la experiencia de Purdue en una conversación sobre los problemas y oportunidades más críticos que enfrenta el mundo.
En un proyecto Goldwasser está analizando publicaciones de Twitter de funcionarios políticos. Los tweets pueden ser una forma de texto difícil de interpretar, porque son breves y pueden resultar ambiguas. Como ejemplo, después de un tiroteo masivo, La frase "pensamientos y oraciones" puede utilizarse con sinceridad para expresar simpatía por las familias de las víctimas. pero también puede usarse sarcásticamente como una crítica a la falta de acción del gobierno sobre el control de armas.
Goldwasser y su equipo están tratando de comprender cómo los políticos enmarcan los problemas o eventos, y cómo ese marco arroja luz sobre su postura sobre el tema. Para hacer esto, combina el análisis lingüístico con el modelado de relaciones y comportamientos sociales. Las redes sociales pueden dar una idea del significado del texto, porque si dos personas están estrechamente relacionadas, es probable que compartan ideologías similares. Comportamiento, como cuando una persona publica en las redes sociales, puede predecir qué temas les preocupan. La combinación de los tres modelos brinda una imagen más completa de la intención del autor que confiar solo en cualquiera de ellos.
En otro proyecto, financiado por Google, Goldwasser está utilizando modelos de relaciones sociales para tratar de identificar sesgos en las fuentes de noticias. Las palabras clave pueden ser una buena forma de diferenciar la ideología para un pequeño conjunto de datos. Por ejemplo, un artículo sobre un tiroteo masivo que se centra en la salud mental del tirador tiene más probabilidades de tener un punto de vista conservador, mientras que un artículo que discute cómo se obtuvo el arma tiene más probabilidades de tener una perspectiva liberal.
"El problema es que la identificación manual de los indicadores relevantes para cada evento es difícil de ampliar, "Dice Goldwasser.
En lugar de, su equipo está recopilando varios artículos de noticias sobre el mismo evento y construyendo una red de personas que comparten los artículos en las redes sociales. Basado en la conexión de la red con individuos u organizaciones con un sesgo político conocido, la perspectiva del artículo se puede inferir sin tener que generar manualmente palabras clave relevantes.