Crédito:CC0 Public Domain
La censura de Internet por parte de gobiernos autoritarios prohíbe el acceso libre y abierto a la información para millones de personas en todo el mundo. Los intentos de evadir tal censura se han convertido en una carrera en continua escalada para mantenerse al día con los siempre cambiantes, censura de Internet cada vez más sofisticada. Los regímenes de censura han tenido la ventaja en esa carrera, porque los investigadores deben buscar manualmente formas de eludir la censura, un proceso que lleva un tiempo considerable.
Un nuevo trabajo dirigido por científicos informáticos de la Universidad de Maryland podría cambiar el equilibrio de la carrera por la censura. Los investigadores desarrollaron una herramienta llamada Ginebra (abreviatura de evasión genética), que aprende automáticamente a eludir la censura. Probado en China, India y Kazajstán, Ginebra encontró docenas de formas de eludir la censura explotando las lagunas en la lógica de los censores y encontrando errores que, según los investigadores, hubieran sido virtualmente imposibles de encontrar manualmente para los humanos.
Los investigadores presentarán a Ginebra durante una charla revisada por pares en la 26a Conferencia sobre Seguridad Informática y de las Comunicaciones de la Association for Computing Machinery en Londres el 14 de noviembre. 2019.
"Con Ginebra, nosotros estamos, por primera vez, con una gran ventaja en la carrera armamentista de la censura, "dijo Dave Levin, profesor asistente de informática en la UMD y autor principal del artículo. "Ginebra representa el primer paso hacia una carrera armamentista completamente nueva en la que los sistemas de inteligencia artificial de censores y evasores compiten entre sí. ganar esta carrera significa llevar la libertad de expresión y la comunicación abierta a millones de usuarios en todo el mundo que actualmente no los tienen ".
Toda la información en Internet es dividida en paquetes de datos por la computadora del remitente y reensamblada por la computadora receptora. Una forma predominante de censura en Internet utilizada por regímenes autoritarios funciona mediante el seguimiento de los paquetes de datos enviados durante una búsqueda en Internet. El censor bloquea las solicitudes que contienen palabras clave marcadas (como "Plaza de Tiananmen" en China) o nombres de dominio prohibidos (como "Wikipedia" en muchos países).
Cuando Geneva se ejecuta en una computadora que envía solicitudes web a través de un censor, Ginebra modifica la forma en que se dividen y envían los datos, para que el censor no reconozca el contenido prohibido o no pueda censurar la conexión.
Conocido como algoritmo genético, Ginebra es un tipo de inteligencia artificial de inspiración biológica que Levin y su equipo desarrollaron para trabajar en segundo plano mientras un usuario navega por la web desde un navegador de Internet estándar. Como sistemas biológicos, Ginebra forma conjuntos de instrucciones a partir de bloques de construcción genéticos. Pero en lugar de utilizar el ADN como bloques de construcción, Ginebra utiliza pequeños fragmentos de código. Individualmente, los bits de código hacen muy poco, pero cuando se compone en instrucciones, pueden realizar sofisticadas estrategias de evasión para separarse, organizar o enviar paquetes de datos.
Ginebra evoluciona su código genético a través de sucesivos intentos (o generaciones). Con cada generación Ginebra mantiene las instrucciones que funcionan mejor para evadir la censura y echa por tierra el resto. Geneva muta y cruza sus estrategias eliminando instrucciones al azar, agregando nuevas instrucciones, o combinar instrucciones exitosas y probar la estrategia nuevamente. A través de este proceso evolutivo, Ginebra es capaz de identificar múltiples estrategias de evasión muy rápidamente.
"Esto invierte completamente la forma en que los investigadores suelen abordar el problema de la censura, "dijo Levin, quien tiene un cargo conjunto en el Instituto de Estudios Informáticos Avanzados de la Universidad de Maryland. "Por lo general, identificamos cómo funciona una estrategia de censura y luego diseñamos estrategias para evadirla. Pero ahora dejamos que Ginebra descubra cómo evadir a la censura, y luego aprendemos qué estrategias de censura se están utilizando al ver cómo Ginebra las derrotó ".
El equipo probó a Ginebra en el laboratorio con censores simulados y en el mundo real con censores reales. En el laboratorio, los investigadores desarrollaron censores que funcionaban como los conocidos de investigaciones previas para ser desplegados por regímenes autocráticos. Dentro de días, Geneva identificó virtualmente todas las estrategias de manipulación de paquetes que habían sido descubiertas por trabajos publicados anteriormente.
Para demostrar que Ginebra funcionó en el mundo real contra estrategias de censura no descubiertas, el equipo ejecutó Geneva en una computadora en China con un navegador Google Chrome sin modificaciones instalado. Mediante el despliegue de estrategias identificadas por Ginebra, el usuario pudo navegar sin censura de palabras clave. Los investigadores también evadieron con éxito la censura en India, que bloquea las URL prohibidas, y Kazajstán, que estaba escuchando a escondidas en ciertos sitios de redes sociales en ese momento. En todos los casos, Ginebra eludió con éxito la censura.
"En la actualidad, el ciclo de evasión-detección requiere una extensa medición manual, ingeniería inversa y creatividad para desarrollar nuevos medios de evasión de la censura, "dijo Kevin Bock (B.S. '17, SRA. '18, Ciencias de la Computación), un doctorado en ciencias de la computación estudiante de la UMD y autor principal del artículo. "Con esta investigación, Ginebra representa un primer paso importante en la automatización de la evasión de la censura ".
Los investigadores planean publicar sus datos y códigos con la esperanza de que brinden acceso abierto a la información en países donde Internet está restringido. El equipo reconoce que puede haber muchas razones por las que las personas que viven bajo regímenes autocráticos podrían no querer o no poder instalar la herramienta en sus computadoras. Sin embargo, permanecen imperturbables. Los investigadores están explorando la posibilidad de implementar Geneva en la computadora que suministra el contenido bloqueado (conocido como servidor) en lugar de en la computadora que busca contenido bloqueado (conocido como el cliente). Eso significaría que sitios web como Wikipedia o la BBC podrían estar disponibles para cualquier persona dentro de los países que actualmente los bloquean. como China e Irán, sin requerir que los usuarios configuren nada en su computadora.
"Si Geneva se puede implementar en el lado del servidor y funciona tan bien como lo hace en el lado del cliente, entonces podría potencialmente abrir las comunicaciones para millones de personas, "Levin dijo." Esa es una posibilidad asombrosa, y es una dirección que seguimos ".