Crédito:IBM
¿Alguna vez te han tratado injustamente? ¿Cómo te hizo sentir? Probablemente no sea demasiado bueno. La mayoría de la gente está de acuerdo en que un mundo más justo es un mundo mejor, y nuestros investigadores de IA no podrían estar más de acuerdo. Es por eso que estamos aprovechando el poder de la ciencia para crear sistemas de inteligencia artificial que sean más justos y precisos.
Muchos de nuestros avances recientes en IA han producido capacidades notables para que las computadoras realicen tareas cada vez más sofisticadas e importantes. como traducir el habla a través de idiomas para unir las comunicaciones entre culturas, mejorar las interacciones complejas entre personas y máquinas, y reconocer automáticamente el contenido del video para ayudar en aplicaciones de seguridad.
Gran parte del poder de la IA en la actualidad proviene del uso del aprendizaje profundo basado en datos para entrenar modelos cada vez más precisos mediante el uso de cantidades cada vez mayores de datos. Sin embargo, la fuerza de estas técnicas también puede ser una debilidad. Los sistemas de IA aprenden lo que se les enseña, y si no se les enseña con conjuntos de datos robustos y diversos, la precisión y la equidad podrían estar en riesgo. Por esta razón, IBM, junto con los desarrolladores de IA y la comunidad de investigación, Es necesario que reflexionemos sobre los datos que utilizamos para la formación. IBM sigue comprometido con el desarrollo de sistemas de inteligencia artificial para hacer que el mundo sea más justo.
El desafío en el entrenamiento de la IA se manifiesta de una manera muy aparente y profunda con la tecnología de reconocimiento facial. Hoy dia, Puede haber dificultades para crear sistemas de reconocimiento facial que cumplan con las expectativas de equidad. El meollo del problema no es la tecnología de IA en sí, per se, pero con cómo se entrenan los sistemas de reconocimiento facial impulsados por IA. Para que los sistemas de reconocimiento facial funcionen como se desea, y los resultados sean cada vez más precisos, los datos de entrenamiento deben ser diversos y ofrecer una amplia cobertura. Por ejemplo, Los conjuntos de datos de entrenamiento deben ser lo suficientemente grandes y diferentes para que la tecnología aprenda todas las formas en que los rostros difieren para reconocer con precisión esas diferencias en una variedad de situaciones. Las imágenes deben reflejar la distribución de las características de los rostros que vemos en el mundo.
Crédito:IBM
¿Cómo medimos y aseguramos la diversidad de rostros humanos? Por un lado, estamos familiarizados con cómo los rostros difieren según la edad, género, y tono de piel, y cómo las diferentes caras pueden variar en algunas de estas dimensiones. Gran parte del enfoque en la tecnología de reconocimiento facial se ha centrado en qué tan bien se desempeña dentro de estos atributos. Pero, como han demostrado estudios anteriores, estos atributos son solo una pieza del rompecabezas y no son del todo adecuados para caracterizar la diversidad completa de rostros humanos. Dimensiones como la simetría de la cara, contraste facial, la pose en la que está la cara, el largo o ancho de los atributos de la cara (ojos, nariz, frente, etc.) también son importantes.
Hoy dia, IBM Research está lanzando un nuevo conjunto de datos grande y diverso llamado Diversity in Faces (DiF) para avanzar en el estudio de la equidad y precisión en la tecnología de reconocimiento facial. El primero de su tipo disponible para la comunidad de investigación global, DiF proporciona un conjunto de datos de anotaciones de 1 millón de imágenes faciales humanas. Usando imágenes disponibles públicamente del conjunto de datos YFCC-100M Creative Commons, Anotamos las caras usando 10 esquemas de codificación independientes y bien establecidos de la literatura científica. [1-10] Los esquemas de codificación incluyen principalmente medidas objetivas de rostros humanos, como rasgos craneofaciales, así como anotaciones más subjetivas, como las predicciones de edad y género etiquetadas por humanos. Creemos que al extraer y publicar estas anotaciones de esquema de codificación facial en un gran conjunto de datos de 1 millón de imágenes de rostros, Aceleraremos el estudio de la diversidad y la cobertura de datos para los sistemas de reconocimiento facial de IA para garantizar sistemas de IA más justos y precisos. El lanzamiento de hoy es simplemente el primer paso.
Creemos que el conjunto de datos DiF y sus 10 esquemas de codificación ofrecen un punto de partida para los investigadores de todo el mundo que estudian la tecnología de reconocimiento facial. Los 10 métodos de codificación facial incluyen craneofacial (p. Ej., longitud de la cabeza, longitud de la nariz, altura de la frente), proporciones faciales (simetría), atributos visuales (edad, género), y pose y resolución, entre otros. Estos esquemas son algunos de los más fuertes identificados por la literatura científica, construyendo una base sólida para nuestro conocimiento colectivo.
Nuestro análisis inicial ha demostrado que el conjunto de datos DiF proporciona una distribución más equilibrada y una cobertura más amplia de imágenes faciales en comparación con los conjuntos de datos anteriores. Es más, La información obtenida del análisis estadístico de los 10 esquemas de codificación iniciales en el conjunto de datos de DiF ha mejorado nuestra propia comprensión de lo que es importante para caracterizar rostros humanos y nos ha permitido continuar una investigación importante sobre formas de mejorar la tecnología de reconocimiento facial.
El conjunto de datos está disponible hoy para la comunidad de investigación global que lo solicite. IBM se enorgullece de hacer que esto esté disponible y nuestro objetivo es ayudar a promover nuestra investigación colectiva y contribuir a crear sistemas de IA que sean más justos.
Si bien IBM Research se compromete a continuar el estudio y la investigación de sistemas de reconocimiento facial más justos, no creemos que podamos hacerlo solos. Con el lanzamiento de hoy, instamos a otros a contribuir al creciente cuerpo de investigación y avanzar en esta importante agenda científica.
Para solicitar acceso al conjunto de datos DiF, visite nuestra pagina web. Para obtener más información sobre DiF, lee nuestro periódico, "Diversidad en los rostros".
Esta historia se vuelve a publicar por cortesía de IBM Research. Lea la historia original aquí.