Un ejemplo de tweets que inspiraron el estudio de investigación. Crédito:Zhang et al.
Ataques distribuidos de denegación de servicio (DDoS), que están diseñados para evitar que usuarios legítimos accedan a sistemas de red específicos, se han vuelto cada vez más comunes durante la última década. Estos ataques hacen que servicios como Facebook, Reddit y los sitios de banca en línea son extremadamente lentos o imposibles de usar al agotar los recursos de la red o del servidor (por ejemplo, banda ancha, CPU y memoria).
Investigadores de todo el mundo han estado intentando desarrollar técnicas para prevenir ataques DDoS o intervenir rápidamente para reducir sus efectos negativos. Un paso importante para contrarrestar estos ataques es la pronta recopilación de comentarios de los usuarios para determinar su impacto y encontrar soluciones específicas.
Teniendo esto en cuenta, un equipo de investigadores de la Universidad de Maryland ha desarrollado un modelo de aprendizaje automático que podría ayudar a determinar la escala del impacto de los ataques DoS a medida que ocurren en función de los tweets publicados por los usuarios. Su estudio, recientemente prepublicado en arXiv, fue financiado por una Beca de Innovación Cibernética UMBC-USNA.
"La investigación se basó en la observación de que cuando hay dificultades para acceder a los servicios de red, los clientes a veces comparten esa información en las redes sociales, "Dr. Tim Oates, uno de los investigadores que realizó el estudio, dijo a TechXplore. "Nuestro principal objetivo era desarrollar un sistema que rastrea los ataques de denegación de servicio (DoS) de la red mediante el análisis de sus efectos dominó a través de publicaciones en las redes sociales".
Para empezar, El Dr. Oates y sus colegas recopilaron un conjunto curado de tweets sobre ataques DoS basados en una línea de tiempo histórica de ataques que ocurrieron en el pasado. Mirando estos tweets, en el que los usuarios describieron los problemas que estaban experimentando durante un ataque, los investigadores pudieron identificar 'patrones de lenguaje' (es decir, palabras clave relevantes). Luego entrenaron a un clasificador de árbol de decisiones para detectar ataques DDoS basados en estas palabras clave.
"Planteamos la hipótesis de que los clientes afectados utilizan un lenguaje similar en las redes sociales para describir problemas durante un ataque DDoS, como que el sistema o el producto se ralentizan o se rastrean, "Chi Zhang, otro investigador involucrado en el estudio le dijo a TechXplore. "Por lo tanto, cuando se recopilan nuevos tweets (históricamente o en tiempo real), el modelo primero descubre los temas (un conjunto de palabras clave que definen ampliamente un área de discusión) de los tweets recopilados en esa ventana de tiempo ".
Después, el clasificador desarrollado por el Dr. Oates, Zhang y sus colegas clasifican los tweets según la diferencia entre las palabras clave y los patrones de idioma observados en las publicaciones de los usuarios durante los ataques DDoS anteriores. Finalmente, el modelo utiliza el número de tweets relacionados con DDos detectados para calcular la escala de impacto de un ataque.
Cuando los investigadores evaluaron su modelo, descubrieron que logró resultados similares a los enfoques supervisados de última generación para determinar la escala de los ataques DDoS. Una gran ventaja de su clasificador, sin embargo, es que está poco supervisado, por lo tanto, requiere muy poco etiquetado humano de los datos de entrenamiento.
"Pudimos desarrollar un modelo débilmente supervisado para la detección de nuevos eventos que funciona casi tan bien como los modelos supervisados, ", Dijo Zhang." Su naturaleza débilmente supervisada significa que sólo se necesita una pequeña cantidad de datos etiquetados por humanos ". por lo tanto, ahorra muchos recursos en términos de trabajo humano, ya que pedir a las personas que anoten potencialmente miles de Tweets suele ser bastante caro ".
En el futuro, su modelo débilmente supervisado podría ayudar a determinar la escala de los ataques DDoS de forma rápida y eficaz, basado únicamente en datos de Twitter. También podría adaptarse y aplicarse a otras tareas que podrían beneficiarse del análisis de los tweets de los usuarios en tiempo real.
En sus próximos estudios, los investigadores planean seguir desarrollando su modelo para analizar los tweets escritos en otros idiomas. Finalmente, también les gustaría cambiar su capa de clasificación para probar su desempeño en la determinación de la escala de impacto de otros tipos de eventos, como brotes de enfermedades (p. ej., Ébola).
"Nos dimos cuenta de que la gente tiene muchas formas de describir los problemas en Twitter, "Ashwinkumar Ganesan, otro investigador que realizó el estudio, dijo a TechXplore. "Por eso, Existe la necesidad de construir un caché más grande de tweets y mejores modelos que manejen esta variación en el lenguaje. Además, los ataques no se limitan a objetivos en el mundo de habla inglesa, por eso, diseñar el sistema para que se pueda escalar a otros idiomas también es muy importante ".
© 2019 Science X Network