• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Otro
    Explorando el uso de palabras extensibles en las redes sociales

    El árbol de la risa. Este árbol de ortografía para versiones extendidas de la palabra 'ha' muestra muchas de las diferentes formas en que estas palabras se escriben a medida que se extienden. Los patrones del árbol representan la ortografía de las palabras, con la inicial 'h' en la raíz, y las siguientes letras se ramifican a la derecha para una 'a' y a la izquierda para una 'h'. Los caminos más gruesos representan patrones más dominantes, con muchas palabras deteniéndose en un nodo interno después de algunas ramificaciones. Algunos de los patrones más largos que llegan a un nodo terminal están anotados con estrellas. La gráfica insertada muestra la frecuencia con la que las diferentes versiones estiradas de 'ha' se basan en el tiempo que se extienden. Algunos puntos están anotados con ejemplos de versiones estiradas de esa longitud, pero el punto representa todas las versiones estiradas de esa longitud. Los puntos para un número par de caracteres tienden a ser más altos debido a la tendencia a alternar perfectamente 'h' y 'a' como en 'jajaja ...'. Crédito:Gray et al, 2020

    Una investigación de los mensajes de Twitter revela nuevos conocimientos y herramientas para estudiar cómo las personas usan palabras extendidas, como "duuuuude, "" heyyyyy, "o" noooooooo ". Tyler Gray y sus colegas de la Universidad de Vermont en Burlington presentan estos hallazgos en la revista de acceso abierto MÁS UNO el 27 de mayo 2020.

    En lenguaje hablado y escrito, las palabras estiradas pueden modificar el significado de una palabra. Por ejemplo, "suuuuure" puede implicar sarcasmo, mientras que "yeeessss" puede indicar emoción. Las palabras estiradas son raras en la escritura formal, pero el auge de las redes sociales ha abierto nuevas oportunidades para estudiarlas.

    Gray y sus colegas han completado el estudio más completo hasta la fecha sobre palabras "extensibles" en las redes sociales. Desarrollaron un nuevo una estrategia más completa para identificar palabras extendidas en tweets y la usó para analizar un conjunto de datos seleccionado al azar de aproximadamente el 10 por ciento de todos los tweets generados entre septiembre de 2008 y diciembre de 2016, por un total de aproximadamente 100 mil millones de tweets.

    Los investigadores identificaron miles de palabras "extensibles" en los tweets, incluyendo "ha" (p. ej., "hahaha" o "haaahaha"), "impresionante" (p. ej., "awesssssommmmmeeeeee") y "gol) (p. ej., ggggoooooaaaaallllll).

    También identificaron dos formas clave de medir las características de las palabras extensibles:equilibrio y estiramiento. El equilibrio se refiere al grado en que las diferentes letras tienden a repetirse. Por ejemplo, "ha" tiene un alto grado de equilibrio porque cuando se estira, la "h" y la "a" tienden a repetirse casi por igual. "Objetivo" está menos equilibrado, con "o" repetida más que cualquier otra letra de la palabra.

    Estirar se refiere a cuánto tiempo tiende a estirarse una palabra. Por ejemplo, las palabras cortas o los sonidos como "ha" tienen un alto grado de estiramiento porque las personas a menudo los repiten muchas veces (p. ej., "jajajajajajaja"). Mientras tanto, las palabras regulares como "infinito" tienen un estiramiento más bajo, a menudo con una sola letra repetida:"infinityyyy".

    Para este análisis, los investigadores desarrollaron varias herramientas y métodos que podrían usarse en futuras investigaciones de palabras extensibles, tales como investigaciones de errores de escritura y de ortografía. Las herramientas también podrían aplicarse para mejorar el procesamiento del lenguaje natural, los motores de búsqueda, y filtros de spam

    Los autores añaden:"Pudimos recopilar y contar de manera integral palabras extensas como 'gooooooaaaalll' y 'jajajaja', y mapearlos en las dos dimensiones de estiramiento general y equilibrio de estiramiento, mientras desarrollan nuevas herramientas que también ayudarán en su estudio lingüístico continuo, y en otras áreas, como el procesamiento del lenguaje, aumento de diccionarios, mejorar los motores de búsqueda, analizar la construcción de secuencias, y más."


    © Ciencia https://es.scienceaq.com