• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Otro
    CLICS:la base de datos de asociaciones léxicas translingüísticas más grande del mundo

    Distribución global de idiomas incluidos en la versión CLICS3, identificado por familia lingüística. Crédito:S. J. Greenhill

    Cada idioma tiene casos en los que dos o más conceptos se expresan con la misma palabra, como la palabra inglesa "volar, "que se refiere tanto al acto de volar como al insecto. Al comparar patrones en estos casos, que los lingüistas llaman colexificaciones, en todos los idiomas, los investigadores pueden obtener conocimientos sobre una amplia gama de cuestiones, incluida la percepción humana, evolución de la lengua y contacto con la lengua. La tercera entrega de la base de datos CLICS aumenta significativamente el número de idiomas, conceptos, y fuentes de datos disponibles en versiones anteriores, permitiendo a los investigadores estudiar las colexificaciones a escala global con un detalle y una profundidad sin precedentes.

    Con flujos de trabajo detallados asistidos por computadora, CLICS facilita la estandarización de conjuntos de datos lingüísticos y proporciona soluciones a muchos de los desafíos persistentes en la investigación lingüística. "Si bien la agregación de datos se basó generalmente en procedimientos ad-hoc en el pasado, Nuestros nuevos flujos de trabajo y directrices para las mejores prácticas son un paso importante para garantizar la reproducibilidad de la investigación lingüística. "dice Tiago Tresoldi.

    Eficacia de CLICS demostrada en aplicaciones de investigación

    La capacidad de CLICS para proporcionar nueva evidencia para abordar cuestiones de vanguardia en psicología y cognición ya ha sido ilustrada en un estudio reciente publicado en Ciencias , que se concentró en la codificación mundial de conceptos emocionales. El estudio comparó redes de colexificación de palabras con conceptos emocionales de una muestra global de idiomas, y reveló que los significados de las emociones varían mucho entre familias lingüísticas.

    "En este estudio, CLICS se utilizó para estudiar las diferencias en la codificación léxica de las emociones en idiomas de todo el mundo, pero el potencial de la base de datos no se limita a los conceptos emocionales. Se pueden abordar muchas más preguntas interesantes en el futuro, "dice Johann-Mattis List.

    Red de colexificación centrada en los conceptos "mano" y "brazo". Crédito:J.-M. Lista, T. Tresoldi

    Los nuevos estándares y flujos de trabajo permiten la recolección reproducible de datos léxicos globales

    Sobre la base de las nuevas directrices para formatos de datos estandarizados en la investigación translingüística, que se presentaron por primera vez en 2018, el equipo de CLICS pudo aumentar la cantidad de datos de 300 variedades de idiomas y 1200 conceptos en la base de datos original a 3156 variedades de idiomas y 2906 conceptos en la instalación actual. La nueva versión también garantiza la reproducibilidad del proceso de agregación de datos, conforme a las mejores prácticas en la gestión de datos de investigación. "Gracias a los nuevos estándares y flujos de trabajo que desarrollamos, nuestros datos no solo son FABLES (se pueden encontrar, accesible, interoperable, y reproducible), pero el proceso de elevar los datos lingüísticos de sus formas originales a nuestros estándares interlingüísticos también es mucho más eficiente que en el pasado, "dice Robert Forkel.

    La efectividad del flujo de trabajo desarrollado para CLICS ha sido probada y confirmada en varios experimentos de validación que involucran a una amplia gama de académicos y estudiantes. Se llevaron a cabo dos tareas diferentes de los estudiantes, dando como resultado la creación de nuevos conjuntos de datos y la mejora progresiva de los datos existentes. A los estudiantes se les asignó la tarea de trabajar en los diferentes pasos de la creación de conjuntos de datos descritos en el estudio, p.ej. extracción de datos, mapeo de datos (a catálogos de referencia), e identificación de fuentes. "Tener personas ajenas al equipo principal que utilicen y prueben sus herramientas es fundamental y ayuda enormemente a afinar todos los procesos, "dice Christoph Rzymski.

    Con CLICS y su flujo de trabajo accesibles a una audiencia más amplia, los académicos no solo pueden contribuir directamente a la base de datos en el futuro; también pueden beneficiarse de la maquinaria establecida y comenzar sus propias colecciones específicas. "El número de lingüistas que utilizan activamente nuestros estándares y flujos de trabajo aumenta constantemente. Esperamos que el lanzamiento de esta nueva versión de CLICS los propague aún más, "dice Simon Greenhill.


    © Ciencia https://es.scienceaq.com