• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • El lenguaje lo delata:cómo un algoritmo puede ayudarnos a detectar noticias falsas

    En un intento por abordar el creciente problema de las noticias falsas en línea, un algoritmo que identifica patrones en el lenguaje puede ayudar a distinguir entre artículos de noticias fácticos e inexactos. Crédito:Shutterstock

    ¿Alguna vez ha leído algo en línea y lo ha compartido entre sus redes? solo para descubrir que era falso?

    Como ingeniera de software y lingüista computacional que pasa la mayor parte de su trabajo e incluso sus horas de ocio frente a la pantalla de una computadora, Me preocupa lo que leo en línea. En la era de las redes sociales, muchos de nosotros consumimos fuentes de noticias poco fiables. Estamos expuestos a un flujo salvaje de información en nuestras redes sociales, especialmente si pasamos mucho tiempo escaneando las publicaciones aleatorias de nuestros amigos en Twitter y Facebook.

    Mis colegas y yo del Laboratorio de Procesamiento de Discursos de la Universidad Simon Fraser hemos realizado una investigación sobre las características lingüísticas de las noticias falsas.

    Los efectos de las noticias falsas

    Un estudio en el Reino Unido encontró que aproximadamente dos tercios de los adultos encuestados leen regularmente noticias en Facebook, y que la mitad de ellos tuvo la experiencia de creer inicialmente una noticia falsa. Otro estudio, realizado por investigadores del Instituto de Tecnología de Massachusetts, se centró en los aspectos cognitivos de la exposición a noticias falsas y descubrió que, de media, los lectores de noticias creen en un titular de noticias falso al menos el 20 por ciento de las veces.

    Las historias falsas se están difundiendo ahora 10 veces más rápido que las noticias reales y el problema de las noticias falsas amenaza seriamente a nuestra sociedad.

    Por ejemplo, durante las elecciones de 2016 en los Estados Unidos, Un número asombroso de ciudadanos estadounidenses creyó y compartió una conspiración evidentemente falsa que afirmaba que Hilary Clinton estaba relacionada con una red de tráfico de personas que se encontraba en una pizzería. El dueño del restaurante recibió amenazas de muerte. y un creyente apareció en el restaurante con una pistola. Esto —y varias otras noticias falsas distribuidas durante la temporada electoral— tuvo un impacto innegable en los votos de la gente.

    A menudo es difícil encontrar el origen de una historia después de grupos partidistas, Los bots de las redes sociales y los amigos de amigos lo han compartido miles de veces. Los sitios web de verificación de hechos como Snopes y Buzzfeed solo pueden abordar una pequeña parte de los rumores más populares.

    La tecnología detrás de Internet y las redes sociales ha permitido esta difusión de información errónea; tal vez sea hora de preguntar qué tiene que ofrecer esta tecnología para abordar el problema.

    En una entrevista, Hilary Clinton analiza "Pizzagate" y el problema de las noticias falsas en línea.

    Sorteos en estilo de escritura

    Los avances recientes en el aprendizaje automático han hecho posible que las computadoras completen instantáneamente tareas que habrían llevado a los humanos mucho más tiempo. Por ejemplo, hay programas de computadora que ayudan a la policía a identificar rostros criminales en cuestión de segundos. Este tipo de inteligencia artificial entrena algoritmos para clasificar, detectar y tomar decisiones.

    Cuando el aprendizaje automático se aplica al procesamiento del lenguaje natural, es posible construir sistemas de clasificación de texto que reconozcan un tipo de texto de otro.

    Durante los últimos años, Los científicos del procesamiento del lenguaje natural se han vuelto más activos en la construcción de algoritmos para detectar información errónea; esto nos ayuda a comprender las características de las noticias falsas y desarrollar tecnología para ayudar a los lectores.

    Un enfoque encuentra fuentes de información relevantes, asigna a cada fuente un puntaje de credibilidad y luego las integra para confirmar o desacreditar una afirmación determinada. Este enfoque depende en gran medida de rastrear la fuente original de noticias y calificar su credibilidad en función de una variedad de factores.

    Un segundo enfoque examina el estilo de redacción de un artículo de noticias en lugar de su origen. Las características lingüísticas de una obra escrita pueden decirnos mucho sobre los autores y sus motivos. Por ejemplo, palabras y frases específicas tienden a aparecer con mayor frecuencia en un texto engañoso en comparación con uno escrito con sinceridad.

    Detectar noticias falsas

    Nuestra investigación identifica características lingüísticas para detectar noticias falsas mediante el aprendizaje automático y la tecnología de procesamiento del lenguaje natural. Nuestro análisis de una gran colección de artículos de noticias verificados por hechos sobre una variedad de temas muestra que, de media, Los artículos de noticias falsos utilizan más expresiones que son comunes en los discursos de incitación al odio. así como palabras relacionadas con el sexo, muerte y ansiedad. Noticias genuinas, por otra parte, contiene una mayor proporción de palabras relacionadas con trabajo (negocios) y dinero (economía).

    Esto sugiere que un enfoque estilístico combinado con el aprendizaje automático podría ser útil para detectar noticias sospechosas.

    Nuestro detector de noticias falsas se basa en características lingüísticas extraídas de una gran cantidad de artículos de noticias. Toma un fragmento de texto y muestra cuán similar es a las noticias falsas y noticias reales que ha visto antes. (¡Pruébalo!)

    El principal desafío, sin embargo, es crear un sistema que pueda manejar la gran variedad de temas de noticias y el cambio rápido de titulares en línea, porque los algoritmos informáticos aprenden de las muestras y si estas muestras no son lo suficientemente representativas de las noticias en línea, las predicciones del modelo no serían fiables.

    Una opción es que los expertos humanos recopilen y etiqueten una gran cantidad de artículos de noticias falsos y reales. Estos datos permiten que un algoritmo de aprendizaje automático encuentre características comunes que continúan ocurriendo en cada colección independientemente de otras variedades. Por último, el algoritmo podrá distinguir con confianza entre artículos de noticias reales o falsos nunca antes vistos.

    Este artículo se ha vuelto a publicar de The Conversation con una licencia de Creative Commons. Lea el artículo original.




    © Ciencia https://es.scienceaq.com