• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  Science >> Ciencia >  >> Otro
    Un investigador utiliza el aprendizaje automático para ayudar a digitalizar textos antiguos de la civilización del Indo
    Una serie de sellos del Indo de Iravatham Mahadevan, un erudito y autor que ha estudiado la escritura del Indo durante décadas. Crédito:Instituto de Tecnología de Florida

    La civilización del valle del río Indo se considera una de las tres primeras civilizaciones de la historia mundial, junto con Mesopotamia y Egipto. Más grande geográficamente que esas dos, ya que se desarrolló a partir del año 3300 a. C. en lo que hoy es Pakistán e India, la civilización del Indo contaba con pesos y medidas uniformes, artesanos expertos, un sistema multifacético de comercio y más de 500 símbolos y signos para comunicarse.



    Pero una pregunta ha molestado a los estudiosos durante décadas y ha obstaculizado los intentos de aprender más sobre esta civilización:¿eran esos caracteres un lenguaje o más parecidos a pictogramas? Incluso cuando algunos expertos comienzan a traducir la escritura de derecha a izquierda que se encuentra en las inscripciones del Indo, hay poco acuerdo.

    "Ésa es una controversia que aún no está resuelta", dijo Debasis Mitra, profesor de informática que ahora está conectado a esta búsqueda gracias a una novedosa subvención que le concedió el Fondo Nacional de Humanidades:"Digitalización y archivo de escrituras antiguas ( ASDA) de artefactos del valle del Indo utilizando aprendizaje profundo."

    El estudiante asistente de posgrado Deva Atturu, quien defenderá su tesis de maestría en abril, está ayudando a Mitra a realizar la investigación financiada por la subvención. Este mes, él y Mitra asistieron virtualmente a la Conferencia de Arqueología del Sur de Asia 2024 de la Universidad de Chicago, donde Atturu presentó su trabajo.

    Los escritos que están estudiando pueden ser una serie de símbolos como el equivalente a signos de dólar e imágenes de transacciones comerciales, o esos símbolos pueden ser grafemas, letras individuales o grupos de letras que representan sonidos del habla.

    "Ambas partes tienen argumentos muy sólidos", afirmó Mitra.

    No busca resolver el argumento sino empoderar a quienes lo deseen mediante el desarrollo de un algoritmo de aprendizaje automático para identificar y digitalizar la escritura antigua de la civilización del Indo. Hay una escasez de datos digitalizados que Mitra espera abordar.

    El proceso utiliza un sistema de reconocimiento automatizado de escritura (ASR) para extraer secuencias codificadas de grafemas de un conjunto de datos de más de 1.000 fotografías de focas del Indo. Utilizando redes neuronales artificiales de dos etapas, el ASR ha logrado un 88 % de éxito en la detección de grafemas.

    Aún así, el proceso ha sido desafiante. A menudo, el aprendizaje automático se potencia al ingresar grandes cantidades de datos para básicamente entrenar el sistema. En este caso, sin embargo, no hay muchos datos que introducir. Y los datos que hay a veces pueden ser "ruidosos" o distorsionados.

    "Trabajo en imágenes médicas y algunos de los desafíos son similares", dijo Mitra.

    Mitra aplica diferentes elementos de aprendizaje automático al proyecto para intentar generar nuevos datos o ver si otro enfoque puede funcionar mejor. Y también participa en conferencias que no suelen estar programadas para científicos informáticos, como la Conferencia Anual del Sur de Asia del año pasado organizada por la Universidad de Wisconsin en Milwaukee, donde presentó este proyecto de aprendizaje automático.

    Asistir a estos lo mantiene en contacto con arqueólogos que pueden brindarle más datos. "Asisto a estas conferencias y trato de hablar con ellos", dijo.

    También solicita la ayuda de estudiantes del Instituto Indio de Estadística en su India natal. Juntos están logrando avances. Pueden digitalizar algunos motivos y grafemas y, dependiendo de la cantidad de datos, incluso crear un guión. Hacer eso y colocarlo en una base de datos es el objetivo de la subvención inicial.

    ¿La siguiente fase? Cree un sistema que permita a los arqueólogos en el campo tomar una fotografía de un texto o símbolo con un teléfono inteligente y enviarla a la base de datos para su digitalización.

    Que estos esfuerzos estén diseñados para ayudar a iluminar y comprender mejor una de las grandes civilizaciones de la historia de su país es una motivación adicional para Mitra.

    "Es parte de mi historia, por lo que hay una motivación adicional para ello. Y obviamente veo que los estudiantes indios están muy interesados ​​por la misma razón", dijo. "Pero uno de los primeros avances fue el de un par de estudiantes estadounidenses que tenían un gran interés en la India, y algunos de ellos dijeron que visitaron la India después".

    Proporcionado por el Instituto de Tecnología de Florida




    © Ciencia https://es.scienceaq.com