Una nueva herramienta de inteligencia artificial creada para ayudar a identificar ciertos tipos de abuso de sustancias basada en las publicaciones de Facebook de un joven sin hogar podría proporcionar a los refugios para personas sin hogar información vital para incorporar en el plan de gestión de casos de cada individuo. Crédito:CC0 Public Domain
Si te pareces al usuario medio de Internet, probablemente no dedicó las 244 horas estimadas que le tomaría leer todas las políticas de privacidad de cada sitio web que visitó el año pasado. Esa es exactamente la razón por la que un equipo dirigido por la Universidad Carnegie Mellon acaba de lanzar un sitio web interactivo destinado a ayudar a los usuarios a comprender su privacidad en la web.
"Hemos combinado el crowdsourcing, aprendizaje automático, y técnicas de procesamiento de lenguaje natural para extraer anotaciones de las políticas de privacidad que ayudan a responder preguntas clave que a menudo preocupan a los usuarios, "dice Norman Sadeh, el investigador principal principal del Proyecto de política de privacidad utilizable, un profesor de la Escuela de Ciencias de la Computación en el Instituto Carnegie Mellon de Investigación de Software, y miembro de la facultad del CyLab Security and Privacy Institute.
El equipo utilizó algoritmos de inteligencia artificial (IA) para rastrear 7, 000 de las políticas de privacidad de los sitios web más populares e identificar aquellos que contienen lenguaje sobre la recopilación y el uso de datos, compartir con terceros, retención de datos, y elección del usuario, entre otras cuestiones de privacidad. El sitio web del proyecto permite a las personas navegar por las políticas de privacidad anotadas por máquinas y saltar directamente a las declaraciones que les interesan. incluidos aquellos a menudo enterrados en el texto de las políticas de privacidad.
La IA de los investigadores también evaluó la legibilidad de cada política de privacidad. Por ejemplo, ABC News encabezó la clasificación con una política de privacidad escrita en un nivel de lectura de "Graduado universitario" (Grado 26). Se descubrió que la política de privacidad de Google se redactó en un nivel de lectura universitario (grado 14), los mismos que los de YouTube, Reddit y Amazon. Se descubrió que la política de privacidad de Facebook era un poco más amigable, escrito a un nivel de lectura de grado 12.
"Descubrimos que el texto de las políticas suele ser vago y ambiguo, y las personas tienden a tener dificultades para interpretar y determinar qué información personal se recopila, cómo se usa, y con qué otras entidades se comparte, "Dice Sadeh." Desde un punto de vista legal, esto es problemático ".
Para "entrenar" su IA, el equipo pidió a un grupo de estudiantes de derecho que anotaran manualmente 115 políticas de privacidad. La IA aprendió de esas anotaciones y luego rastreó las políticas de más de 7, 000 de los sitios más populares de la web.
"Aunque no es perfecto, Nuestras técnicas son capaces de extraer automáticamente una gran cantidad de declaraciones de privacidad del texto de las políticas de privacidad, "dice Sadeh". el objetivo es poner esta información a disposición de los usuarios a través de un complemento de navegador simple e intuitivo que proporcionaría a los usuarios resúmenes personalizados que resalten los problemas que probablemente les interesen ".