• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Limpieza de las redes sociales con aprendizaje automático

    Crédito:CC0 Dominio público

    El spam de contenido para adultos o pornográfico es un problema creciente en las redes sociales. Nueva investigación en el International Journal of Business Intelligence and Data Mining analiza cómo dicho contenido puede detectarse rápidamente y eliminarse de manera oportuna.

    Deepali Dhaka, Surbhi Kakar y Monica Mehrotra de Jamia Millia Islamia (Universidad Central) en Jamia Nagar, Nueva Delhi, India, explican cómo se podría mejorar la experiencia general del usuario y la de los jóvenes que usan las redes sociales si se filtra el contenido de spam obsceno. con eficacia y rapidez. Las herramientas de aprendizaje automático suelen ser el camino a seguir para detectar tipos particulares de contenido y el equipo ha demostrado que una de esas herramientas, XGboost, puede detectar contenido de spam para adultos con más del 90 % de precisión. Este fue el algoritmo de clasificación más efectivo de los seis probados y adaptados por el equipo para detectar spam pornográfico en Twitter.

    Como tal, menos de diez de cada cien actualizaciones marcadas como spam para adultos serían falsos positivos. El enfoque del equipo necesitaba analizar solo una pequeña cantidad de características, el sistema de valores, la entropía de las palabras, la diversidad léxica y las incrustaciones de palabras, para poder extraer actualizaciones de spam para adultos del flujo general de actualizaciones en uno de los más conocidos. plataformas de redes sociales, Twitter.

    Inherente a la detección positiva es que, en general, los usuarios cotidianos de la plataforma discuten una amplia variedad de temas en diferentes contextos y escriben y comparten en lo que podría denominarse una forma orgánica. Por el contrario, los spammers y los spammers pornográficos, en este caso, tienden a tener un enfoque fijo o incluso completamente automatizado para sus actualizaciones, una diversidad limitada de temas, como cabría esperar, y un léxico muy limitado. Estas y otras características de los mensajes de spam los hacen reconocibles para el algoritmo. + Explora más

    Twitter dice que elimina 1 millón de cuentas de spam al día




    © Ciencia https://es.scienceaq.com