El resultado de detectar una cornucopia (cuerno de la abundancia) con el nuevo modelo. Cooper y Arandjelovic.
Dos investigadores de la Universidad de St. Andrews, en Escocia, Recientemente, han desarrollado un nuevo método basado en el aprendizaje automático para comprender imágenes de monedas antiguas. Su estudio, prepublicado en arXiv aplica la visión por computadora y el aprendizaje automático a la numismática antigua.
"Mi investigación en este campo fue el resultado de unir dos pasiones:mi interés continuo por las monedas antiguas (yo mismo tengo una gran colección) y el estado del arte en IA, "Ognjen Arandjelovic, uno de los investigadores que realizó el estudio, dijo a TechXplore. "En 2010, Escribí un artículo sobre el tema y, para mi sorpresa, ya que normalmente se trata de un nicho de interés, atrajo mucha atención ".
La mayoría de los estudios anteriores han intentado comprender mejor las monedas antiguas utilizando técnicas genéricas de reconocimiento de objetos. El conocimiento y la comprensión de Arandjelovic de la numismática antigua, sin embargo, lo llevó a creer que estos enfoques están lejos de ser óptimos y lo alentó a desarrollar métodos alternativos. Durante la última década más o menos, ha publicado una serie de artículos que se desvían del patrón mencionado.
La estructura de la red neuronal. Crédito:Cooper &Arandjelovic.
Se ha descubierto que la mayoría de los métodos de vanguardia existentes para el análisis de monedas antiguas funcionan bastante mal. En su estudio, Arandjelovic y su colega Jessica Cooper se propusieron desarrollar un enfoque más eficaz, que puede describir una moneda como lo haría un humano a otro humano.
"El trabajo con Jessica se debe a que me di cuenta de que el campo ha estado tomando un ángulo muy equivocado al tratar de determinar si dos monedas son iguales, "Arandjelovic explicó." La razón de esto se debe al hecho de que pocos tipos de monedas antiguas (en relación con las decenas de miles acuñadas durante los cinco siglos del Imperio Romano) que se han imaginado son bastante pequeñas, haciendo que el enfoque tenga poca importancia práctica. Jessica y yo pensamos que habría sido mucho mejor si la computadora pudiera describir la moneda, tanto como un humano lo haría con otro humano ".
"Estoy muy interesado en algoritmos que imitan la forma en que los humanos abordan las tareas, "Cooper dijo a TechXplore" Cuando un experto describe una moneda antigua, identifica conceptos representados artísticamente de la misma manera que lo hace nuestro sistema:reconociendo formas en la imagen. También es capaz de señalar los elementos que describe:'hay una cornucopia', 'hay un escudo', etc. Nuestro sistema también hace esto ".
Las descripciones detalladas son una parte crucial de la literatura numismática, por lo tanto, descubrir información detallada sobre las monedas utilizando técnicas de aprendizaje automático podría resultar muy útil. Las descripciones de las monedas están escritas actualmente por expertos humanos, que puede llevar bastante tiempo. El nuevo método desarrollado por Arandjelovic y Cooper podría ayudar a acelerar el análisis de monedas antiguas, automatizando una parte importante del mismo.
Ejemplo 1 de ejemplares de la misma moneda, con diferentes grados de daño. El emperador del anverso es Antoninus Pius. Crédito:Cooper &Arandjelovic.
"Usamos el llamado Deep Learning, que utiliza un tipo específico de red neuronal (estas están vagamente, muy vagamente de hecho, motivadas por redes neuronales que comprenden nuestro cerebro) para aprender de muchos ejemplos de monedas que contienen y que no contienen un elemento visual específico (por ejemplo, escudo, lanza, etc.), ", Dijo Arandjelovic." Por supuesto, así es como los humanos aprenden en la infancia:a través de la exposición repetida y la retroalimentación del supervisor (padre, profesor, etc.) ".
La mayoría de los enfoques existentes funcionan haciendo coincidir visualmente monedas, utilizando herramientas de reconocimiento de objetos. Sin embargo, el número de tipos de monedas antiguas supera con creces los tipos de monedas que han sido registrados por expertos digitalmente o en papel, que es la razón por la que estos métodos a menudo funcionan mal.
Ejemplo 2 de ejemplares de la misma moneda, con diferentes grados de daño. El emperador del anverso es Antoninus Pius. Crédito:Cooper &Arandjelovic.
A diferencia de los enfoques anteriores, el método ideado por Arandjelovic y Cooper analiza el contenido semántico de las monedas. Primeramente, los investigadores utilizaron entradas multimodales del mundo real para extraer y asociar conceptos semánticos con las imágenes de monedas correctas. Después, entrenaron una red neuronal convolucional (CNN) sobre la aparición de estos conceptos.
"Nuestro resultado más importante es la prueba de concepto, que podemos esperar razonablemente que marque un punto de inflexión en la dirección del campo, ", Dijo Arandjelovic." Ya tenemos muchas ideas nuevas sobre cómo mejorar lo que hemos hecho hasta ahora, y confío en que otros investigadores se sientan inspirados para proponer diferentes ideas que también se basen en nuestra contribución ".
Los investigadores evaluaron su método en el mayor conjunto de datos existente de monedas antiguas, que incluye imágenes de monedas extraídas de 100, 000 lotes de subasta. Sus pruebas arrojaron resultados muy prometedores, con su algoritmo haciendo asociaciones correctas e identificando con precisión patrones semánticos en monedas antiguas.
Ejemplo 3 de ejemplares de la misma moneda, con diferentes grados de daño. El emperador del anverso es Antoninus Pius. Crédito:Cooper &Arandjelovic.
"Creo que nuestros datos son realmente interesantes porque son un desafío:hay mucho desequilibrio de clases, mucho ruido, y las imágenes solo están etiquetadas en todo el nivel de la imagen, Cooper dijo. Por lo tanto, durante el entrenamiento, el modelo se dice solo si existe un determinado elemento en la moneda, pero no donde está, debe aprender eso por sí mismo. Resolver problemas en conjuntos de datos difíciles como este es valioso no solo por sí mismo, pero también porque los enfoques desarrollados para un caso de uso a menudo se pueden aplicar con éxito en una variedad de dominios ".
La CNN utilizada por Arandjelovic y Cooper se basa libremente en una reconocida red neuronal artificial llamada AlexNet. que se utilizó originalmente para clasificar fotografías del conjunto de datos de ImageNet. Según Cooper, su estudio ofrece un claro ejemplo de cómo este tipo de polinización cruzada puede resultar muy valioso. Actualmente está trabajando en un proyecto que aplica técnicas similares de visión por computadora al diagnóstico de cáncer a partir de escáneres médicos.
El resultado de detectar una cornucopia (cuerno de la abundancia) con el nuevo modelo. Cooper y Arandjelovic.
"Tenemos varios planes para futuras investigaciones, "Arandjelovic dijo." En primer lugar, planeamos continuar directamente esta investigación, como nos gustaría tener un sistema que describa literalmente la imagen de una moneda, usando completo, oraciones adecuadas, al igual que los que vería describiendo monedas cuando se venden en subastas. También nos gustaría desarrollar métodos que monitoreen los sitios de subastas en línea para detectar monedas robadas o monedas falsas ".
© 2019 Science X Network