Arquitectura del codificador propuesta por los investigadores. Crédito:Roy &Grangier.
En años recientes, Los investigadores han estado tratando de desarrollar métodos para parafrasear automáticamente, que esencialmente implica la abstracción automatizada del contenido semántico del texto. Hasta aquí, Los enfoques que se basan en técnicas de traducción automática (MT) han demostrado ser particularmente populares debido a la falta de conjuntos de datos etiquetados disponibles de pares parafraseados.
Teóricamente las técnicas de traducción pueden parecer soluciones efectivas para la paráfrasis automática, ya que abstraen el contenido semántico de su realización lingüística. Por ejemplo, asignar la misma oración a diferentes traductores puede resultar en diferentes traducciones y un rico conjunto de interpretaciones, que podría ser útil para parafrasear tareas.
Aunque muchos investigadores han desarrollado métodos basados en la traducción para la paráfrasis automatizada, los humanos no necesariamente necesitan ser bilingües para parafrasear oraciones. Basado en esta observación, dos investigadores de Google Research han propuesto recientemente una nueva técnica de paráfrasis que no se basa en métodos de traducción automática. En su papel prepublicado en arXiv, compararon su enfoque monolingüe con otras técnicas de paráfrasis:una traducción supervisada y un enfoque de traducción no supervisada.
"Este trabajo propone aprender a parafrasear modelos de un corpus monolingüe sin etiquetar únicamente, "Aurko Roy y David Grangier, los dos investigadores que realizaron el estudio, escribió en su periódico. "Con ese fin, proponemos una variante residual de autocodificador variacional cuantificado por vector ".
El modelo presentado por los investigadores se basa en codificadores automáticos cuantificados por vectores (VQ-VAE) que pueden parafrasear oraciones en un entorno puramente monolingüe. También tiene una característica única (es decir, conexiones residuales paralelas al cuello de botella cuantificado), lo que permite un mejor control sobre la entropía del decodificador y facilita la optimización.
"En comparación con los codificadores automáticos continuos, nuestro método permite la generación de diversos, pero oraciones cerradas semánticamente de una oración de entrada, ", explicaron los investigadores en su artículo.
En su estudio, Roy y Grangier compararon el desempeño de su modelo con el de otros enfoques basados en MT para la identificación de paráfrasis, aumento de generación y entrenamiento. Lo compararon específicamente con un método de traducción supervisado capacitado en datos bilingües paralelos y un método de traducción no supervisado capacitado en texto no paralelo en dos idiomas diferentes. Su modelo, por otra parte, solo requiere datos sin etiquetar en un solo idioma, en el que está parafraseando oraciones.
Los investigadores encontraron que su enfoque monolingüe superó a las técnicas de traducción no supervisadas en todas las tareas. Comparaciones entre su modelo y los métodos de traducción supervisados, por otra parte, arrojó resultados mixtos:el enfoque monolingüe se desempeñó mejor en las tareas de identificación y aumento, mientras que el método de traducción supervisada fue superior para la generación de paráfrasis.
"En general, Demostramos que los modelos monolingües pueden superar a los bilingües para la identificación de paráfrasis y el aumento de datos mediante paráfrasis, "concluyeron los investigadores." También informamos que la calidad de generación de modelos monolingües puede ser mayor que los modelos basados en traducción no supervisada, pero no traducción supervisada ".
Los hallazgos de Roy y Grangier sugieren que el uso de datos paralelos bilingües (es decir, textos y sus posibles traducciones en otros idiomas) es particularmente ventajoso al generar paráfrasis y conduce a un desempeño notable. En situaciones en las que los datos bilingües no estén fácilmente disponibles, sin embargo, el modelo monolingüe propuesto por ellos podría ser un recurso útil o una solución alternativa.
© 2019 Science X Network