A las redes neuronales se les enseña a reconocer objetos similares en videos sin degradación de la precisión

La IA servirá para desarrollar un sistema de control de red que no solo detecta y reacciona ante problemas, sino que también puede predecirlos y evitarlos. Crédito:CC0 Public Domain

Andrey Savchenko, Profesor de la Escuela Superior de Economía (Universidad HSE), ha desarrollado un método que puede ayudar a mejorar la identificación de imágenes en videos. En su proyecto, Un nuevo algoritmo enseñó una red y ahora puede tomar decisiones sobre el reconocimiento y la clasificación de imágenes a un ritmo 10 veces más rápido que antes. Esta investigación se presentó en el artículo "Decisiones secuenciales de tres vías en el reconocimiento de imágenes de múltiples categorías con características profundas basadas en el factor de distancia" publicado en Ciencias de la información .

Las redes neuronales aprendieron a identificar humanos y animales en videos hace mucho tiempo. Las neuronas artificiales pueden aprender recordando cómo se ve cierto objeto en una imagen. Generalmente, los investigadores toman una base de datos abierta de fotos (por ejemplo, ImageNet, Lugares, etc.) y utilícelo para enseñar una red neuronal. Para acelerar el proceso de toma de decisiones, nuestro algoritmo está configurado para seleccionar solo algunas de las imágenes de muestra, o centrarse en un número limitado de rasgos. Pueden surgir complicaciones cuando hay objetos de diferentes clases en la misma foto, y solo hay una pequeña cantidad de ejemplos de capacitación para cada categoría.

El nuevo algoritmo ahora puede reconocer imágenes sin una degradación significativa de la precisión mediante la aplicación de un método secuencial de toma de decisiones de tres vías. Al emplear este enfoque, una red neuronal puede analizar imágenes simples de una manera para objetos claramente reconocibles, mientras que los objetos que son difíciles de identificar pueden recibir un examen más detallado.

"Cada foto se puede describir mediante miles de funciones. Por lo tanto, no tendría mucho sentido comparar todas las características de una imagen de entrada determinada con las de un ejemplo de entrenamiento básico, ya que la mayoría de las muestras no serían similares a la imagen analizada. Entonces, inicialmente solo comparamos algunas de las características importantes, y dejar de lado las instancias de formación, que obviamente no pueden tratarse como soluciones finales. Como resultado, la muestra de entrenamiento se hace más pequeña y solo quedan algunos ejemplos. En la siguiente etapa, aumentaríamos la cantidad de funciones para las imágenes restantes, y luego repita este proceso hasta que solo quede una clase, "Señaló el profesor Savchenko.

Este enfoque redujo el tiempo de reconocimiento de 1,5 a 10 veces, en comparación con los clasificadores regulares y las decisiones secuenciales de tres vías de múltiples categorías conocidas. Como resultado, esta tecnología podría usarse en el futuro en dispositivos móviles y otros dispositivos básicos.

Apple dice que los aranceles estadounidenses a China serían contraproducentes

Cómo 5G podría democratizar la industria de las telecomunicaciones

Electrónica