• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • La nueva aplicación puede detectar bots de Twitter en cualquier idioma

    Crédito:CC0 Public Domain

    Gracias a la fructífera colaboración entre los estudiosos de idiomas y los especialistas en aprendizaje automático, una nueva aplicación desarrollada por investigadores de la Universidad de Finlandia Oriental y la Universidad de Linnaeus en Suecia puede detectar bots de Twitter independientemente del idioma utilizado.

    En años recientes, Los macrodatos de varias aplicaciones de redes sociales han convertido a la web en un depósito de información generado por el usuario en un número cada vez mayor de áreas. Debido al acceso relativamente fácil a los tweets y sus metadatos, Twitter se ha convertido en una fuente popular de datos para la investigación de una serie de fenómenos. Éstos incluyen, por ejemplo, varias campañas políticas, convulsiones sociales y políticas, Twitter como herramienta de comunicación de emergencia, y el uso de datos de las redes sociales para predecir los precios del mercado de valores.

    Sin embargo, La investigación que utiliza datos de las redes sociales a menudo se ve sesgada por la presencia de bots. Los bots son cuentas automatizadas y no personales que publican contenido en redes sociales en línea. La popularidad de Twitter como instrumento en el debate público ha llevado a una situación en la que se ha convertido en un objetivo ideal de spammers y scripts automatizados. Se ha estimado que entre el 5 y el 10% de todos los usuarios son bots, y que estas cuentas generan alrededor del 20-25% de todos los tweets publicados.

    Investigadores de humanidades digitales de la Universidad de Finlandia Oriental y la Universidad de Linnaeus en Suecia han desarrollado una nueva aplicación que se basa en el aprendizaje automático para detectar bots de Twitter. La aplicación es capaz de detectar tweets autogenerados independientemente del idioma utilizado. Los investigadores capturaron para el análisis un total de 15, 000 tweets en finlandés, Sueco e inglés. El finlandés y el sueco se utilizaron principalmente para la formación, mientras que los tweets en inglés se utilizaron para evaluar la independencia lingüística de la aplicación. La aplicación es ligera, lo que permite clasificar grandes cantidades de datos de forma rápida y relativamente eficiente.

    "Esto mejora la calidad de los datos y ofrece una imagen más precisa de la realidad, "Observa el profesor de inglés Mikko Laitinen de la Universidad de Finlandia Oriental.

    Según el profesor Laitinen, los bots son relativamente inofensivos, mientras que los trolls hacen daño cuando difunden noticias falsas e inventan historias inventadas. Es por eso que se necesitan herramientas cada vez más avanzadas para el monitoreo de las redes sociales.

    "Este es un tema complejo y requiere enfoques interdisciplinarios. Por ejemplo, los lingüistas trabajamos junto con especialistas en aprendizaje automático. Este tipo de trabajo también requiere determinación e inversiones en infraestructuras de investigación que sirvan de plataforma para la colaboración de investigadores de diferentes campos ”.

    Según el profesor Laitinen, es fundamental que los investigadores tengan acceso a los datos de las redes sociales.

    "En la actualidad, los datos son propiedad de conglomerados tecnológicos estadounidenses, y una fuente de ingresos. Para que los investigadores tengan acceso a estos datos, cooperación a nivel nacional e internacional, y especialmente se necesita la participación de la UE ".


    © Ciencia https://es.scienceaq.com