Esta foto de agosto de 2017 proporcionada por Shamima Khatoon muestra a Khatoon en Nueva Delhi. El trabajo de Khatoon de anotar autos, marcadores de carril y semáforos en un puesto de avanzada exclusivamente femenino de la empresa de etiquetado de datos iMerit en Metiabruz, India, representa la única oportunidad que tiene de trabajar fuera de casa en una región musulmana conservadora de la India. (Mushtari Fatma Zarin / Cortesía de Shamima Khatoon vía AP)
Hay un pequeño secreto sucio sobre la inteligencia artificial:está impulsada por cientos de miles de personas reales.
Desde maquilladores en Venezuela hasta mujeres en zonas conservadoras de India, personas de todo el mundo están haciendo el equivalente digital a la costura:dibujar recuadros alrededor de automóviles en fotografías de calles, etiquetado de imágenes, y transcribir fragmentos de habla que las computadoras no logran descifrar.
Dichos datos se alimentan directamente de los algoritmos de "aprendizaje automático" que ayudan a los vehículos autónomos a atravesar el tráfico y permiten que Alexa se dé cuenta de que usted quiere las luces encendidas. Muchas de estas tecnologías no funcionarían sin cantidades masivas de estos datos etiquetados por humanos.
Estas tareas repetitivas pagan centavos cada una. Pero a granel Este trabajo puede ofrecer un salario decente en muchas partes del mundo, incluso en los EE. UU. Esta industria artesanal floreciente, pero en gran parte invisible, representa la base de una tecnología que podría cambiar a la humanidad para siempre:la IA que nos conducirá, ejecutar comandos verbales sin fallas, y, posiblemente, un día piensa por su cuenta.
___
Esta industria de insumos humanos ha sido alimentada durante mucho tiempo por los motores de búsqueda Google y Bing, que durante más de una década han utilizado a personas para calificar la precisión de sus resultados. Desde 2005, Servicio Mechanical Turk de Amazon, que empareja a trabajadores independientes con trabajos temporales en línea, también ha puesto a disposición de los investigadores de todo el mundo la entrada de datos de fuentes múltiples.
Más recientemente, los inversores han invertido decenas de millones de dólares en nuevas empresas como Mighty AI y CrowdFlower, que están desarrollando software que facilita el etiquetado de fotografías y otros datos, incluso en teléfonos inteligentes.
Esta combinación de imágenes sin fecha proporcionada por CrowdFlower muestra el antes y el después de las representaciones de la tecnología Human-in-the-Loop de CrowdFlower, que proporciona herramientas sofisticadas que permiten a una persona etiquetar y estructurar cada parte de una foto normal y convertirla en "datos de entrenamiento" estructurados que un sistema de inteligencia artificial puede comprender e interpretar. (CrowdFlower vía AP)
El capitalista de riesgo S. "Soma" Somasegar dice que ve "miles de millones de dólares en oportunidades" para satisfacer las necesidades de los algoritmos de aprendizaje automático. Su firma, Madrona Venture Group, invertido en Mighty AI. Los humanos estarán al tanto "durante mucho tiempo, largo, mucho tiempo por venir " él dice.
Un etiquetado preciso podría marcar la diferencia entre un automóvil autónomo que distingue entre el cielo y el costado de un camión, una distinción que el Model S de Tesla falló en la primera fatalidad conocida que involucró sistemas de conducción autónoma en 2016.
"No estamos creando un sistema para jugar, estamos construyendo un sistema para salvar vidas, "dice el CEO de Mighty AI, Daryn Nakhuda.
___
Marjorie Aguilar, una maquilladora freelance de 31 años en Maracaibo, Venezuela, pasa de cuatro a seis horas al día dibujando recuadros alrededor de los objetos de tráfico para ayudar a entrenar sistemas de conducción autónoma para Mighty AI.
Ella gana alrededor de 50 centavos la hora, pero en un país devastado por la crisis con una inflación desbocada, Unas pocas horas de trabajo pueden pagar el alquiler de un mes en bolívares.
"No parece mucho dinero, pero para mi es bastante decente, "Puede imaginarse lo importante que es para mí que me paguen en dólares estadounidenses".
Esta foto sin fecha proporcionada por Marjorie Aguilar muestra a Aguilar en Maracaibo, Venezuela. Aguilar, maquilladora freelance en Maracaibo, pasa de cuatro a seis horas al día dibujando recuadros alrededor de los objetos de tráfico para ayudar a entrenar sistemas de conducción autónoma para Mighty AI. (Cortesía de Marjorie Aguilar vía AP)
Aria Khrisna, un padre de tres hijos de 36 años en Tegal, Indonesia, dice que hacer cosas como agregar etiquetas de palabras a las imágenes de la ropa en sitios web como eBay y Amazon le paga alrededor de $ 100 al mes, aproximadamente la mitad de sus ingresos.
Y para Shamima Khatoon, de 25 años, su trabajo anotando autos, marcadores de carril y semáforos en un puesto de avanzada exclusivamente femenino de la empresa de etiquetado de datos iMerit en Metiabruz, India, representa la única oportunidad que tiene de trabajar fuera de casa en su conservadora comunidad musulmana.
"Es una buena plataforma para aumentar sus habilidades y apoyar a su familia, " ella dice.
___
Los principales fabricantes de automóviles como Toyota, Nissan y Ford, empresas de transporte privado como Uber y otros gigantes tecnológicos como Waymo de Alphabet Inc. están pagando montones de etiquetadores, a menudo a través de proveedores externos.
Los beneficios de una mayor precisión pueden ser inmediatos.
En InterContinental Hotels Group, cada llamada que su asistente digital Amelia puede recibir de un humano ahorra entre $ 5 y $ 10, dice el director de tecnología de la información, Scot Whigham.
En este 8 de noviembre, 2017, foto Jessica McShane, un empleado de Interactions Corp., supervisa las comunicaciones de persona a computadora, ayudar a las computadoras a comprender lo que dice un humano, en la sala de "análisis de intenciones" de la sede de la empresa en Franklin, Mass. Cuando una computadora no puede distinguir la llamada de un cliente a la cadena de hoteles Hyatt, se envía un fragmento de audio a las interacciones del centro de llamadas con tecnología de inteligencia artificial. Allí, mientras el cliente espera al teléfono, un analista transcribe todo, desde números mal escuchados hasta blasfemias, y rápidamente indica a la computadora cómo responder. (Foto AP / Steven Senne)
Cuando Amelia falla, el programa escucha mientras se redirige una llamada a uno de los aproximadamente 60 trabajadores de la mesa de servicio. Aprende de su respuesta y prueba la técnica en la siguiente llamada, liberar a los empleados humanos para que hagan otras cosas.
"Hemos transformado esos trabajos, "Dice Whigham.
Cuando una computadora no puede distinguir la llamada de un cliente a la cadena de hoteles Hyatt, se envía un fragmento de audio al centro de llamadas con inteligencia artificial Interacciones en un antiguo edificio de ladrillos en Franklin, Massachusetts.
Allí, mientras el cliente espera al teléfono, uno de los muchos "analistas de intenciones" que usan auriculares transcribe todo, desde números mal escuchados hasta blasfemias, y rápidamente indica a la computadora cómo responder.
Esa información se retroalimenta al sistema. "La próxima vez, tenemos más posibilidades de tener éxito, "dice Robert Nagle, Director de tecnología de Interacciones.
___
Los investigadores han intentado encontrar soluciones alternativas a los datos etiquetados por humanos, pero los resultados suelen ser inadecuados.
En este 8 de noviembre, 2017, Foto, Jessica McShane, un empleado de Interactions Corp., primer plano, supervisa las comunicaciones de persona a computadora, ayudar a las computadoras a comprender lo que dice un humano, en la sala de "análisis de intenciones" de la sede de la empresa en Franklin, Mass. "Esa información se utiliza para enviar comentarios al sistema mediante el aprendizaje automático para mejorar nuestro modelo, "dijo Robert Nagle, Director de tecnología de Interacciones. "La próxima vez, tenemos más posibilidades de tener éxito ". (AP Photo / Steven Senne)
En un proyecto que utilizó imágenes de automóviles estacionados en Google Street View para estimar la composición demográfica de los vecindarios, El entonces investigador de Stanford, Timnit Gebru, trató de entrenar su IA raspando fotos de Craigslist de autos en venta que fueron etiquetados por sus dueños.
Pero las tomas de productos no se parecían en nada a las imágenes de automóviles en Street View, y el programa no pudo reconocerlos. En el final, ella dice, ella gastó $ 35, 000 para contratar a expertos en concesionarios de automóviles para etiquetar sus datos.
La necesidad de etiquetadoras humanas es "enorme" y "dinámica, "dice Robin Bordoli, CEO de la empresa de tecnología de etiquetado CrowdFlower. "No se puede confiar al 100 por ciento en el algoritmo".
___
En este momento, Averiguar cómo hacer que las computadoras aprendan sin los llamados datos de "verdad fundamental" proporcionados por humanos sigue siendo una cuestión de investigación abierta.
Trevor Darrell, experto en aprendizaje automático de la Universidad de California en Berkeley, dice que espera que pasen de cinco a 10 años antes de que los algoritmos informáticos puedan aprender a funcionar sin la necesidad de etiquetado humano.
Solo su grupo gasta cientos de miles de dólares al año pagando a las personas para que realicen anotaciones en las imágenes. "Ahora, si vendes un producto y quieres la perfección, sería negligente no invertir el dinero en ese tipo de anotación, " él dice.
Este miercoles, 29 de noviembre 2017, La foto proporcionada por Aria Khrisna muestra a Krishna y su hijo Raka de 3 años. Khrisna, un padre de tres hijos de 36 años en Tegal, Indonesia, dice que hacer cosas como agregar etiquetas de palabras a las imágenes de la ropa en sitios web como eBay y Amazon le paga alrededor de $ 100 al mes, aproximadamente la mitad de sus ingresos. (Indah Nurul Hidayah / Aria Khrisna vía AP)
Varias empresas como Waymo de Alphabet y el fabricante de juegos Unity Technologies están desarrollando mundos simulados para entrenar sus algoritmos en escenarios controlados donde cada objeto viene predefinido.
En la mayor parte, incluso las empresas que intentan sacar a los humanos del circuito siguen confiando en ellos.
CloudSight, por ejemplo, ofrece a los desarrolladores de sitios web y aplicaciones una herramienta útil para cargar una foto y obtener algunas palabras para describirla. El minorista Kohl's utiliza el servicio para una función de búsqueda visual "Snap and Shop" en su aplicación.
Pero no es solo un sofisticado programa de computadora que responde. Si el algoritmo no tiene una buena respuesta, uno de sus 800 empleados en lugares como India, El sudeste de Asia o África escribe la respuesta en tiempo real.
"Queremos ser los que puedan etiquetar cualquier imagen sin la participación humana, "dice Ian Parnes, Jefe de desarrollo empresarial de CloudSight. "Cuánto tiempo llevará eso es una incógnita".
© 2018 The Associated Press. Reservados todos los derechos.