PizzaGAN tiene una idea de cómo hacer una pizza

¿Nada es sagrado? ¿Quién se atrevería a intentar siquiera hablar sobre un experimento de aprendizaje automático que da como resultado la pizza perfecta (jadeo)? Es dificil de contemplar pero un quinteto de investigación no rehuyó intentarlo, y trabajaron para enseñarle a una máquina cómo hacer un gran pastel.

Saluda a PizzaGAN, un modelo generativo basado en capas de composición que tenía como objetivo reflejar el procedimiento paso a paso de la fabricación de pizza.

Su objetivo era enseñar a la máquina mediante la construcción de un modelo generativo que refleja un conjunto ordenado de instrucciones. Cómo procedieron:"Cada operador está diseñado como una Red Adversarial Generativa (GAN). Dada solo una supervisión débil a nivel de imagen, los operadores están capacitados para generar una capa visual que debe agregarse o eliminarse de la imagen existente. El modelo propuesto es capaz de descomponer una imagen en una secuencia ordenada de capas aplicando secuencialmente en el orden correcto los módulos de eliminación correspondientes ".

(Las redes generativas de confrontación pueden hacer muchas cosas, Victoria Song comentó en Gizmodo . Dijo que era "básicamente el tipo de aprendizaje automático utilizado para generar caras de IA realistas y deepfakes").

Resultados? Baste decir que informaron haber hecho un modelo a su satisfacción. "Los resultados experimentales en imágenes de pizza sintéticas y reales demuestran que nuestro modelo propuesto es capaz de:(1) segmentar los ingredientes de las pizzas de una manera poco supervisada, (2) elimínelos revelando lo que está ocluido debajo de ellos (es decir, en pintura), e (3) inferir el orden de las coberturas sin ninguna supervisión de orden en profundidad ".

El equipo habló sobre sus conjuntos de datos de pizza sintética y real.

"La pizza es la comida más fotografiada en Instagram con más de 38 millones de publicaciones con el hashtag #pizza, ", dijeron. Descargaron medio millón de imágenes de Instagram usando varios hashtags populares relacionados con la pizza. Filtraron imágenes no deseadas usando un clasificador basado en CNN entrenado en un conjunto de imágenes de pizza / no pizza etiquetadas manualmente.

Recopilaron etiquetas a nivel de imagen para los ingredientes de las pizzas en Amazon Mechanical Turk (AMT) para 9, 213 imágenes de pizza.

Para su conjunto de datos de pizza sintética, utilizaron imágenes de pizza estilo clip art. "Hay dos ventajas principales de crear un conjunto de datos con pizzas sintéticas. Primero, nos permite generar un conjunto arbitrariamente grande de ejemplos de pizzas con un costo de anotación humano cero. Segundo y más importante, tenemos acceso a información de pedidos precisa y real y segmentación de píxeles de múltiples capas de los ingredientes ".

Entonces, en el panorama general, qué aportación han hecho, Si alguna, a la humanidad? Victoria Song hizo un punto, cuando ella escribió, "A la larga, uno podría imaginar una red neuronal que pudiera escanear una foto y escupir una receta bastante precisa basada en ingredientes, lo bien que está cocido, e incluso especias apenas visibles ".

Después de que todo esté dicho (y hecho), "La investigación está demostrando principalmente la capacidad de una IA para diferenciar entre una pila confusa de ingredientes". Lo sabían cuando se dispusieron a centrarse en la pizza. Piense en un "ejemplo arquetípico" de algo que necesita la adición secuencial de ingredientes en un orden específico.

En el panorama general, la pizza no es el único artículo que podría utilizar su enfoque. "Aunque hemos evaluado nuestro modelo solo en el contexto de la pizza, Creemos que un enfoque similar es prometedor para otros tipos de alimentos que tienen capas naturales, como las hamburguesas, bocadillos, y ensaladas ".

Para obtener más información sobre su investigación, su trabajo se titula, "Cómo hacer una pizza:aprender un modelo de GAN basado en capas de composición, "por Dim Papadopoulos, Youssef Tamaazousti, Ferda Ofli, Ingmar Weber y Antonio Torralba. El documento está en arXiv. El documento fue presentado a principios de este mes.

El nuevo tatuaje electrónico permite monitorización cardíaca ininterrumpida durante días

Resultados de imágenes, los datos de salud se combinan en un modelo de inteligencia artificial para predecir el cáncer de mama

Electrónica