• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Una red neuronal para extraer fragmentos y documentos informados

    Estructura del modelo propuesto. Crédito:Zhou et al.

    Cotidiano, millones de artículos se publican en las redes sociales y otras plataformas, recibir una gran cantidad de clics y acciones de usuarios que navegan por la web. Muchos de estos artículos contienen información útil que, si se extrae, podría utilizarse para compilar bases de datos de conocimientos o para prestar servicios de recuperación de conocimientos y de respuesta a preguntas.

    Investigadores de la Academia China de Ciencias (CAS) han desarrollado un modelo basado en la red neuronal convolucional (CNN) para extraer fragmentos informados y anotar documentos. Su método, descrito en un artículo publicado previamente en arXiv, se encontró que funciona mejor que las herramientas existentes, a pesar de haber sido entrenado por períodos de tiempo más cortos.

    En su papel los investigadores definen el término "documento informado" como "un documento que contiene varios fragmentos informativos, que describen conceptos, propiedades de entidades, o las relaciones entre entidades ". Hasta ahora, la mayoría de las bases de conocimiento, como YAGO o DBpedia, extraer conocimiento basado en Wikipedia, WordNet, GeoNames, y otros recursos en línea. Sin embargo, en comparación con las plataformas de redes sociales, estos recursos a menudo contienen información limitada e inflexible.

    "Otra base de conocimientos reciente, Probase, con 2,7 millones de conceptos, se aprovechó automáticamente del corpus más grande hasta ahora, que consta de 326 millones de oraciones informadas extraídas de 1,68 mil millones de páginas web, "escribieron los investigadores en su artículo". Sin embargo, estas oraciones son extraídas únicamente por los patrones de Hearst. Para extraer fragmentos de mayor conocimiento para construir bases de conocimiento más completas, Se necesitan métodos basados ​​en la semántica para complementar los anteriores basados ​​en patrones ".

    Ejemplo de documento informado. Las oraciones azul y roja son fragmentos informados y desconocidos, respectivamente. El documento presenta los 25 consejos para la compra de inmuebles. Crédito:Zhou et al.

    También se podrían utilizar fragmentos y artículos informados para desarrollar servicios de recuperación de conocimientos y respuesta a preguntas. Estos servicios por ejemplo, responder a las preguntas planteadas por los usuarios que buscan ayuda con un problema en particular. Con estas aplicaciones en mente, los investigadores de CAS se propusieron desarrollar un modelo basado en CNN que puede analizar la semántica de un documento, determinar si tiene conocimiento o no, y extraer de él fragmentos de información bien informados.

    "Específicamente, proponemos SSNN, un modelo conjunto basado en CNN, comprender el concepto abstracto de documentos en diferentes dominios de manera colaborativa y juzgar si un documento tiene conocimiento o no, "explican los investigadores en su artículo". Con más detalle, la estructura de red de SSNN es 'uso compartido de bajo nivel, división de alto nivel "en el que las capas de bajo nivel se comparten para diferentes dominios, mientras que las capas de alto nivel más allá de la CNN se entrenan por separado para percibir las diferencias de diferentes dominios".

    El modelo ideado por los investigadores ofrece una solución de extremo a extremo para anotar documentos que no implica una ingeniería de características extensa y que requiere mucho tiempo. También desarrollaron funciones manuales y entrenaron un modelo de clasificador SVM para completar la tarea.

    Ejemplo de documento informado. Las oraciones azul y roja son fragmentos informados y desconocidos, respectivamente. El documento presenta las habilidades de conducción para girar. Crédito:Zhou et al.

    Los investigadores evaluaron la efectividad de su modelo en un conjunto de datos de documentos reales de tres dominios de contenido en WeChat, un mensaje chino, plataforma de pago móvil y redes sociales desarrollada por Tencent. Sus hallazgos fueron muy prometedores, con el SSNN funcionando constantemente mejor que otros modelos de CNN, al tiempo que se ahorra tiempo y consumo de memoria gracias a procesos de formación más cortos y eficientes.

    "En comparación con la creación de varias CNN de dominios específicos, Este modelo conjunto no solo ahorra críticamente el tiempo de formación, pero también mejora visiblemente la precisión de la predicción, "Los investigadores escribieron en su artículo." La superioridad del modelo propuesto se demuestra en un conjunto de datos real de las plataformas públicas de Wechat ".

    En el futuro, el modelo SSNN propuesto en este estudio podría usarse para construir bases de datos de conocimiento más completas. También podría ayudar al desarrollo de servicios innovadores que respondan a las consultas de los usuarios de forma rápida y exhaustiva en tiempo real.

    © 2018 Tech Xplore




    © Ciencia https://es.scienceaq.com