• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Un modelo para predecir el tamaño y la forma de los hilos de comentarios en línea.

    Ejemplo de un proceso de ramificación de Hawkes. El nodo rojo (extremo izquierdo) representa una publicación en las redes sociales. Los nodos verde y azul representan eventos de "inmigrantes" y "descendientes", respectivamente. Crédito:Krohn &Weninger, adaptado con permiso del trabajo de Medvedev et al.

    En plataformas de redes sociales como Reddit y Twitter, las personas pueden expresar sus opiniones y participar en discusiones sobre una variedad de temas. Esto generalmente se hace en hilos de comentarios, que permiten a los usuarios comentar publicaciones existentes.

    Un hilo de comentarios es esencialmente una conversación entre diferentes usuarios en línea en forma de comentarios. En informática, los hilos de comentarios a menudo se consideran "árboles, "con nodos que representan la publicación original y los comentarios posteriores, y bordes dirigidos que representan relaciones de "respuesta a".

    Dos investigadores de la Universidad de Notre Dame han desarrollado recientemente un modelo para predecir el tamaño y la forma de los hilos de comentarios en línea cuando los ven como árboles. Llamaron a este modelo, introducido en un artículo publicado previamente en arXiv, el Modelo de predicción de hilos de comentarios (CTPM).

    "Nuestro principal objetivo de investigación es predecir el tamaño y la forma de un hilo de comentarios en los sitios de redes sociales, "Tim Weninger, uno de los investigadores que realizó el estudio, dijo a TechXplore. "Estos sitios permiten a los usuarios publicar noticias, imágenes u otro contenido. Luego, a otros usuarios les gusta, compartir o comentar la publicación. Nos interesan principalmente los hilos de comentarios, donde un usuario puede comentar la publicación en sí o responder a comentarios como en Reddit y Twitter (pero no en Facebook o YouTube) ".

    El estudio realizado por Weninger y su colega Rachel Krohn fue financiado por un programa de la Agencia de Proyectos de Investigación Avanzada de Defensa de EE. UU. (DARPA), que se centra específicamente en la simulación social. Una de las preguntas que plantea este programa es si es posible simular la actividad de las redes sociales.

    Estudios anteriores sugieren que las primeras horas de la vida de una publicación son de vital importancia para predecir su popularidad futura. De hecho, Las publicaciones que reciben mucha atención desde el principio y que los usuarios comentan inmediatamente generan más discusiones en línea en el futuro. Por otra parte, las publicaciones que inicialmente no reciben mucha atención tienden a atraer también menos atención en el futuro.

    La mayoría de las técnicas existentes diseñadas para predecir el tamaño y la forma de los hilos de comentarios funcionan al observar los primeros comentarios que se agregan a una publicación y luego crear un modelo predictivo. Sin embargo, como la mayoría de los hilos de comentarios son relativamente pequeños, esperar a que se generen nuevos datos puede perjudicar el objetivo general de la tarea de predicción.

    El programa DARPA que financió el estudio instruyó específicamente a los investigadores a investigar si podían predecir la popularidad de una publicación. incluyendo el número de comentarios que suscitaría en el futuro, basado únicamente en su título. Con este objetivo en mente, el equipo desarrolló un modelo que analiza las palabras en el título de una publicación de Reddit, junto con el usuario de publicación y el subreddit al que se envió. Estas variables se utilizan para crear un "proceso de Hawkes, "un modelo estadístico utilizado para representar puntos matemáticos en el espacio.

    "Usamos un proceso de Hawkes para simular cómo las personas ven la publicación, leer un comentario, y luego decide responder a cada comentario, ", Dijo Weninger." El modelo no es perfecto y en realidad no simula el contenido de los comentarios (es decir, no adivinamos lo que dice realmente el comentario, solo si hay un comentario o no), sin embargo, en promedio, hacemos un buen trabajo al predecir qué comentarios serán populares y cuáles no lo serán solo en función del título, autor y subreddit de una publicación ".

    Weninger y sus colegas evaluaron el modelo CTPM en miles de discusiones de usuarios reales tomadas de Reddit, comparar su eficacia para predecir el tamaño y la forma de los hilos de comentarios con la de otras técnicas. Notablemente, su modelo superó significativamente a todos los modelos y líneas de base existentes con los que se comparó.

    "Para mí, la contribución más significativa de este trabajo es la capacidad de nuestro modelo para predecir el tamaño y la forma de las conversaciones en línea, Weninger dijo. Esto es importante para las agencias policiales y de defensa de EE. UU. Porque poder predecir el futuro en el ciberespacio permite a estas agencias preparar defensas efectivas contra ciberataques y otros eventos que con frecuencia se mueven del mundo cibernético al mundo físico. "

    En el futuro, el modelo propuesto por Weninger y sus colegas podría usarse para predecir la popularidad de las publicaciones en Twitter o Reddit basándose únicamente en su título. El equipo ahora planea continuar investigando cómo los humanos consumen y seleccionan información en línea. incluyendo sus interacciones con las publicaciones de otros (por ejemplo, me gusta, Comparte, retweets, etc.).

    "Los gustos, Comparte, votos a favor, y los retweets proporcionados por los usuarios son lo más importante para las empresas de redes sociales porque indican qué contenido promocionar y qué contenido puede ser spam o de baja calidad. Weninger dijo. "Estudiamos estos procesos y cómo pueden ser corrompidos por individuos o grupos con malas intenciones". Nuestro trabajo futuro en esta área analizará las manipulaciones del contenido social (por ejemplo, alteraciones de imágenes, Photoshop, deepfakes, etc.), ya que podemos aprender mucho sobre las personas y su cultura observando cómo alteran las imágenes en las redes sociales ".

    © 2019 Science X Network




    © Ciencia https://es.scienceaq.com