• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Los humanos comprimen las imágenes mejor que los algoritmos, hallazgos del experimento

    Dada la imagen de la izquierda, dos participantes del estudio hicieron la reconstrucción de la derecha. La gente prefirió su reconstrucción a la imagen del centro, una versión altamente comprimida del original con un tamaño de archivo igual a la cantidad de datos que los participantes usaron para hacer su reconstrucción. Crédito:Ashutosh Bhown, Soham Mukherjee y Sean Yang

    Tu amiga te envía un mensaje de texto con una foto del perro que está a punto de adoptar, pero todo lo que ves es un bronceado. neblina de píxeles con forma vagamente animal. Para darte una imagen más amplia envía el enlace al perfil de adopción del perro porque le preocupa su límite de datos. Un clic y su pantalla se llena con descripciones e imágenes mucho más satisfactorias de su futura mejor amiga.

    Enviar un enlace en lugar de cargar una imagen masiva es solo un truco que usan los humanos para transmitir información sin quemar datos. De hecho, estos trucos pueden inspirar una clase completamente nueva de algoritmos de compresión de imágenes, según una investigación de un equipo de ingenieros y estudiantes de secundaria de la Universidad de Stanford.

    Los investigadores pidieron a las personas que compararan las imágenes producidas por un algoritmo de compresión tradicional que encoge imágenes enormes en borrones pixelados con las creadas por humanos en condiciones de restricción de datos:comunicación de solo texto, que podría incluir enlaces a imágenes públicas. En muchos casos, los productos del intercambio de imágenes impulsado por humanos resultaron más satisfactorios que el trabajo del algoritmo. Los investigadores presentarán su trabajo el 28 de marzo en la Conferencia de Compresión de Datos de 2019.

    "Casi todos los compresores de imágenes que tenemos en la actualidad se evalúan utilizando métricas que no necesariamente representan lo que los humanos valoran en una imagen, "dijo Irena Fischer-Hwang, estudiante de posgrado en ingeniería eléctrica y coautor del artículo. "Resulta que nuestros algoritmos tienen un largo camino por recorrer y pueden aprender mucho de la forma en que los humanos comparten información".

    El proyecto fue el resultado de una colaboración entre investigadores liderados por Tsachy Weissman, profesor de ingeniería eléctrica, y tres estudiantes de secundaria que hicieron una pasantía en su laboratorio.

    "Honestamente, Entramos en esta colaboración con el objetivo de brindarles a los estudiantes algo que no los distraiga demasiado de la investigación en curso, ", dijo Weissman." Pero ellos querían hacer más, y ese descaro llevó a un artículo y un impulso de investigación completamente nuevo para el grupo. Este muy bien podría convertirse en uno de los proyectos más emocionantes en los que he estado involucrado ".

    Crédito:Universidad de Stanford

    Una imagen con menos pérdida

    Conversión de imágenes a formato comprimido, como un JPEG, los hace significativamente más pequeños, pero pierde algunos detalles; esta forma de conversión a menudo se denomina "con pérdidas" por esa razón. La imagen resultante es de menor calidad porque el algoritmo tiene que sacrificar detalles sobre el color y la luminancia para consumir menos datos. Aunque los algoritmos conservan suficientes detalles para la mayoría de los casos, Los pasantes de Weissman pensaron que podrían hacerlo mejor.

    En sus experimentos, dos estudiantes trabajaron juntos de forma remota para recrear imágenes utilizando software gratuito de edición de fotografías e imágenes públicas de Internet. Una persona de la pareja tenía la imagen de referencia y guió a la segunda persona en la reconstrucción de la foto. Ambas personas podían ver la reconstrucción en progreso, pero el descriptor solo podía comunicarse por texto mientras escuchaba hablar a su compañero.

    El tamaño de archivo eventual de la imagen reconstruida fue el tamaño comprimido de los mensajes de texto enviados por el descriptor porque eso es lo que se requeriría para recrear esa imagen. (El grupo no incluyó información de audio).

    Luego, los estudiantes compararon las reconstrucciones humanas con las imágenes comprimidas por máquina con tamaños de archivo que igualaban a los de los archivos de texto de reconstrucción. Entonces, si un equipo humano crea una imagen con solo 2 kilobytes de texto, comprimieron el archivo original al mismo tamaño. Con acceso a las imágenes originales, 100 personas fuera de los experimentos calificaron la reconstrucción humana mejor que la compresión basada en máquinas en 10 de 13 imágenes.

    Caras borrosas bien

    Cuando las imágenes originales coincidían estrechamente con las imágenes públicas de Internet, como una intersección de calles, las reconstrucciones hechas por humanos funcionaron particularmente bien. Incluso las reconstrucciones que combinaban varias imágenes solían funcionar bien, excepto en los casos que presentaban rostros humanos. Los investigadores no pidieron a sus jueces que explicaran su clasificación, pero tienen algunas ideas sobre las disparidades que encontraron.

    Crédito:Universidad de Stanford

    "En algunos escenarios, como escenas de la naturaleza, a la gente no le importaba si los árboles eran un poco diferentes o si la jirafa era una jirafa diferente. Les importaba más que la imagen no fuera borrosa, lo que significa que la compresión tradicional se clasificó más baja, "dijo Shubham Chandak, estudiante de posgrado en el grupo de Weissman y coautor del artículo. "Pero para rostros humanos, la gente prefiere tener la misma cara incluso si está borrosa ".

    Esta aparente debilidad en el intercambio de imágenes basado en humanos mejoraría a medida que más personas carguen imágenes de sí mismas en Internet. Los investigadores también se están asociando con un dibujante de la policía para ver cómo su experiencia podría marcar la diferencia. Aunque este trabajo muestra el valor de la participación humana, los investigadores eventualmente intentarían automatizar el proceso.

    "El aprendizaje automático funciona en partes y partes de esto, y espero que podamos hacer que trabajen juntos pronto, "dijo Kedar Tatwawadi, estudiante de posgrado en el grupo de Weissman y coautor del artículo. "Parece que un compresor práctico que funciona con este tipo de ideología no está muy lejos".

    Llamando a todos los estudiantes

    Weissman destacó el valor de la contribución de los estudiantes de secundaria, incluso más allá de este documento.

    "Decenas, si no cientos de miles de horas de ingeniería humana, se dedicaron al diseño de un algoritmo que tres estudiantes de secundaria vinieron y patearon en el trasero, ", dijo Weissman." Es una lección de humildad considerar lo lejos que estamos en nuestra ingeniería ".

    Debido al éxito de esta colaboración, Weissman ha creado un programa formal de pasantías de verano en su laboratorio para estudiantes de secundaria. Imaginando cómo un artista o estudiantes interesados ​​en psicología o neurociencia podrían contribuir a este trabajo, está particularmente interesado en atraer a estudiantes con diversos intereses y antecedentes.


    © Ciencia https://es.scienceaq.com