Crédito:Brooks y Barron, Investigación de Google.
Los investigadores de Google han desarrollado recientemente una nueva técnica para sintetizar una imagen borrosa por movimiento, utilizando un par de imágenes no borrosas capturadas en sucesión. En su papel prepublicado el arXiv , los investigadores describieron su enfoque y lo evaluaron contra varios métodos de referencia.
El desenfoque de movimiento ocurre naturalmente cuando los objetos en una escena o la propia cámara se mueven mientras se toma una imagen. Esto da como resultado que los objetos en movimiento o la imagen completa aparezcan borrosos. En algunos casos, El desenfoque de movimiento se puede utilizar para indicar la velocidad de un sujeto fotografiado o para separarlo del fondo.
"El desenfoque de movimiento es una pista valiosa en el contexto de la comprensión de imágenes, "Tim Brooks y Jonathan Barron, los investigadores que llevaron a cabo el estudio, escribió en su periódico. "Dada una sola imagen que contiene desenfoque de movimiento, se puede estimar la dirección relativa y la magnitud del movimiento de la escena que resultó en el desenfoque observado. Esta estimación de movimiento puede ser semánticamente significativa, o puede ser utilizado por un algoritmo de desenfoque para sintetizar una imagen nítida ".
Investigaciones recientes han investigado el uso de algoritmos de aprendizaje profundo para eliminar el desenfoque de movimiento no deseado de las imágenes o para inferir la dinámica del movimiento de una escena determinada. Para entrenar estos algoritmos, sin embargo, los investigadores necesitan una cantidad sustancial de datos, que normalmente se genera al difuminar sintéticamente imágenes nítidas. Por último, La medida en que un algoritmo de aprendizaje profundo puede eliminar eficazmente el desenfoque de movimiento en imágenes reales depende en gran medida del realismo de los datos sintéticos utilizados para entrenarlo.
"En este papel, tratamos la inversa de esta tarea de estimación / eliminación de borrosidad bien estudiada como un problema de primera clase, "Brooks y Barron escribieron en su artículo." Presentamos una forma rápida y efectiva de sintetizar los datos de entrenamiento necesarios para entrenar un algoritmo de desenfoque de movimiento, y demostramos cuantitativamente que nuestra técnica se generaliza desde nuestros datos de entrenamiento sintéticos hasta imágenes reales de movimiento borroso ".
La arquitectura de red neuronal ideada por Brooks y Barron incluye una nueva capa de "predicción de línea", que enseña un sistema para retroceder desde pares de imágenes de imágenes tomadas consecutivamente a una imagen borrosa en movimiento que abarca el tiempo de captura de estas dos imágenes de entrada. Su modelo requiere una gran cantidad de datos de entrenamiento, por lo que los investigadores diseñaron y ejecutaron una estrategia que utiliza técnicas de interpolación de cuadros para generar un gran conjunto de datos sintéticos de imágenes borrosas en movimiento, junto con sus respectivas entradas.
Brooks y Barron también capturaron un conjunto de prueba de alta calidad de imágenes borrosas en movimiento real sintetizadas a partir de videos en cámara lenta y luego lo usaron para evaluar su modelo frente a técnicas de referencia. Su modelo logró resultados muy prometedores, superando los enfoques existentes tanto en precisión como en velocidad.
"Nuestro enfoque es rápido, preciso, y utiliza imágenes fácilmente disponibles de videos o 'ráfagas' como entrada, y, por lo tanto, proporciona un camino para permitir la manipulación del desenfoque de movimiento en aplicaciones de fotografía de consumo, y para sintetizar los datos de entrenamiento realistas necesarios mediante algoritmos de desvanecimiento o estimación de movimiento, "escribieron los investigadores en su artículo.
Si bien los fotógrafos y directores de fotografía experimentados a menudo usan el desenfoque de movimiento como efecto artístico, Producir fotografías efectivas con movimiento borroso puede ser un gran desafío. En la mayoría de los casos, estas imágenes son el producto de un largo proceso de prueba y error, que requieren habilidades y equipos avanzados.
Debido a las dificultades para lograr efectos de desenfoque de movimiento de calidad, la mayoría de las cámaras de consumo están diseñadas para tomar imágenes con el menor desenfoque de movimiento posible. Esto significa que los fotógrafos aficionados tienen muy poco espacio para experimentar con el desenfoque de movimiento en sus imágenes.
"Al permitir que las imágenes borrosas en movimiento se sinteticen a partir de las imágenes no borrosas convencionales que capturan las cámaras de consumo estándar, nuestra técnica permite a los no expertos crear imágenes borrosas por movimiento en un entorno posterior a la captura, ", explicaron los investigadores en su artículo.
Por último, el enfoque ideado por Brooks y Barron podría tener varias aplicaciones interesantes. Por ejemplo, podría hacer que el desenfoque de movimiento artístico sea accesible para fotógrafos ocasionales, al mismo tiempo que genera imágenes borrosas de movimiento más realistas para entrenar algoritmos de aprendizaje profundo.
© 2018 Science X Network