• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Un enfoque de aprendizaje profundo para identificar la ubicación de los usuarios de Twitter durante emergencias

    Arquitectura general para la red neuronal convolucional (CNN). Crédito:Singh y Kumar.

    Investigadores del Instituto Nacional de Tecnología de Patna, En India, recientemente diseñaron una herramienta para identificar la ubicación geográfica de emergencias y desastres, así como el de las personas involucradas en ellos. Su enfoque esbozado en un documento en el Revista Internacional de Reducción del Riesgo de Desastres , extrae información de ubicación de tweets utilizando un modelo basado en la red neuronal convolucional (CNN).

    "Durante las emergencias, la información de ubicación geográfica de los eventos, así como la de los usuarios afectados, son de vital importancia, "Jyoti Prakash Singh, uno de los investigadores que realizó el estudio, dijo a TechXplore. "Identificar esta ubicación geográfica es una tarea desafiante, ya que los campos de ubicación disponibles, como la ubicación del usuario y el nombre del lugar de los tweets, no son confiables. La ubicación GPS precisa de los usuarios es rara en los tweets, y también a veces incorrecto en términos de información espacio-temporal ".

    Las personas afectadas por desastres naturales u otras emergencias a menudo comparten su ubicación en las redes sociales, pidiendo ayuda. Esta información podría ayudar a las unidades de respuesta y a las autoridades locales a detectar eventos de manera temprana, localizar a las víctimas y ayudarlas. Sin embargo, extraer datos relacionados con la ubicación de los tweets es una tarea muy desafiante, ya que a menudo están escritos en un inglés no estándar y contienen errores gramaticales, errores ortográficos o abreviaturas.

    "Es casi imposible para los operadores humanos que rastrean tweets revisar cada tweet y encontrar la información de ubicación mencionada en ellos, ", Dijo Singh." Esto nos motivó a desarrollar una solución para extraer automáticamente la información de ubicación de los tweets que solicitaban ayuda. En este trabajo, utilizamos el aprendizaje profundo para determinar si un tweet contiene nombres de ubicación y resaltar estas palabras ".

    Singh y su colega Abhivan Kumar desarrollaron un modelo de CNN que puede identificar la ubicación de los usuarios analizando el contenido de sus tweets. Eligieron este enfoque de aprendizaje profundo específico porque puede aprender automáticamente la mejor representación de los datos de entrada y usarlo para identificar referencias de ubicación.

    "Usamos una técnica de incrustación de palabras para representar tweets en la capa de entrada de la CNN y las referencias de ubicación presentes en el tweet se representan en la capa de salida en forma de un vector cero-uno, "Singh explicó." Las palabras de ubicación están codificadas como 1 y las palabras que no son de ubicación están codificadas como 0. Usamos varias combinaciones de 2 gramos, 3 gramos, 4 gramos y filtros de 5 gramos para extraer características del tweet. Después de entrenar para el modelo de las 100 épocas, es capaz de predecir las referencias de ubicación mencionadas en el tweet con una precisión impresionante ".

    En una evaluación inicial, el modelo de CNN ideado por Singh y Kumar pudo extraer todas las palabras relacionadas con la ubicación de los tweets con una precisión muy alta, incluso cuando el texto de un tweet era ruidoso. Los investigadores probaron su modelo en tweets que no habían sido procesados ​​previamente y contenían errores gramaticales. errores tipográficos abreviaturas, y otros factores de confusión.

    "La principal implicación práctica de nuestro trabajo es que se puede canalizar fácilmente, utilizando modelos de detección de eventos, Singh dijo:"Los modelos de detección de eventos pueden identificar tweets relacionados con dicho desastre y nuestro modelo puede extraer la ubicación de las víctimas afectadas por ese desastre".

    En el futuro, el modelo de CNN desarrollado por los investigadores podría ayudar a localizar rápidamente eventos de emergencia y personas que requieren asistencia urgente. El mismo enfoque también podría aplicarse a los disturbios civiles, publicidad dirigida, observar el comportamiento humano regional, gestión del tráfico rodado en tiempo real y otros servicios basados ​​en la ubicación.

    "En este trabajo solo consideramos los tweets en inglés, pero durante una crisis, los usuarios también publican tweets en sus idiomas regionales, ", Dijo Singh." Por lo tanto, estamos trabajando en un modelo que aborde esta limitación multilingüe, al mismo tiempo que se trata de desarrollar un modelo semi-supervisado para reducir el problema del etiquetado de datos ".

    © 2018 Science X Network




    © Ciencia https://es.scienceaq.com