• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Otro
    El análisis de miles de millones de palabras en Twitter revela cómo se desarrolla el inglés americano

    Crédito:CC0 Public Domain

    Lingüistas y geógrafos analizaron 8,9 mil millones de palabras contenidas en 980 millones de tweets publicados en los Estados Unidos entre 2013 y 2014 para identificar las regiones de las que tienden a originarse nuevas palabras.

    Dirigido por el profesor Jack Grieve, del Centro de Investigación de Corpus de la Universidad de Birmingham, Los investigadores utilizaron tecnología informática avanzada para analizar los Tweets geocodificados que revelaron la longitud y latitud precisas del usuario en el momento de la publicación.

    Rastrearon el origen de 54 palabras emergentes en inglés estadounidense. Por ejemplo, encontraron que la palabra 'baeless', que significa 'ser soltero', se originó en el sur profundo, mientras que la palabra 'mutuos', que es la abreviatura de 'amigos mutuos', se originó en la costa oeste.

    Los datos geocodificados de Twitter les permitieron crear mapas para estas 54 palabras, mostrando cómo las frases se habían extendido por todo el país a lo largo del tiempo.

    Aplicar técnicas computacionales modernas al estudio de la variación y el cambio del lenguaje, el equipo identificó que el desarrollo de nuevas palabras en inglés americano moderno se centró en cinco regiones:la costa oeste, el noreste, el Atlántico Medio, el sur profundo, y la Costa del Golfo.

    El profesor Grieve comentó:"Esta es la primera vez que se ha mapeado una muestra tan grande de palabras emergentes o cualquier tipo de innovación lingüística en un idioma. Twitter es solo una variedad de idioma, pero dado que casi todas estas palabras se usan en el habla cotidiana, Creemos que nuestros resultados reflejan la difusión general de las palabras en inglés americano.

    "Nuestro estudio proporciona un marco para la investigación futura al mostrar cómo se puede medir y mapear el origen y la propagación de las palabras emergentes. La lingüística está pasando de una ciencia social a una ciencia de datos, donde los lingüistas analizan cada vez más cantidades masivas de lenguaje natural recolectado en línea.

    "Esto nos permite buscar nuevas preguntas de investigación que hubieran sido imposibles de investigar hace tan solo unos años. Podemos analizar con gran detalle cómo cambia el lenguaje en períodos cortos de tiempo y comprender los procesos a través de los cuales evolucionan los lenguajes, uno de los las preguntas más desafiantes de la ciencia ".

    Los hallazgos de los investigadores también desafían las teorías existentes sobre la difusión de nuevas palabras. Muestran que las palabras nuevas no se extienden simplemente sin restricciones desde su fuente, ni se esparcen de una gran ciudad a otra, como lo predijeron las teorías desarrolladas previamente para la difusión de nuevas palabras, conocido como los modelos de "onda" y "gravedad".

    En lugar de, el estudio encontró que la difusión de nuevas palabras está limitada por patrones culturales. Las palabras nuevas tienden a extenderse dentro de las regiones culturales, antes de llegar al resto de Estados Unidos. También descubrió que el inglés afroamericano era una fuente importante de innovación léxica en Twitter de EE. UU.

    El profesor Grieve habla sobre la investigación del equipo en la conferencia New Ways of Analyzing Variation (NWAV) celebrada en la Universidad de Nueva York del 18 al 21 de octubre. Se centrará en cómo estas palabras se difundieron solo en la ciudad de Nueva York durante el período de tiempo en cuestión. además de impartir un taller sobre "sociolingüística computacional".


    © Ciencia https://es.scienceaq.com