• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • IA más inteligente:aprendizaje automático sin datos negativos

    Esquema que muestra datos positivos (manzanas) y falta de datos negativos (bananas), con una ilustración de la confianza de los datos de Apple. Crédito:RIKEN

    Un equipo de investigación del Centro RIKEN para el Proyecto de Inteligencia Avanzada (AIP) ha desarrollado con éxito un nuevo método de aprendizaje automático que permite a una IA realizar clasificaciones sin lo que se conoce como "datos negativos, "un hallazgo que podría conducir a una aplicación más amplia a una variedad de tareas de clasificación.

    Clasificar las cosas es fundamental para nuestra vida diaria. Por ejemplo, tenemos que detectar el correo no deseado, noticias políticas falsas, así como cosas más mundanas como objetos o caras. Al usar IA, tales tareas se basan en la "tecnología de clasificación" en el aprendizaje automático:hacer que la computadora aprenda utilizando el límite que separa los datos positivos y negativos. Por ejemplo, Los datos "positivos" serían fotos que incluyan una cara feliz, y fotos de datos "negativos" que incluyen una cara triste. Una vez que se aprende un límite de clasificación, la computadora puede determinar si ciertos datos son positivos o negativos. La dificultad de esta tecnología es que requiere tanto datos positivos como negativos para el proceso de aprendizaje, y los datos negativos no están disponibles en muchos casos (por ejemplo, es difícil encontrar fotos con la etiqueta, "esta foto incluye una cara triste, "ya que la mayoría de la gente sonríe frente a una cámara).

    En términos de programas de la vida real, cuando un minorista intenta predecir quién realizará una compra, puede encontrar fácilmente datos sobre los clientes que les compraron (datos positivos), pero es básicamente imposible obtener datos sobre clientes que no les compraron (datos negativos), ya que no tienen acceso a los datos de sus competidores. Otro ejemplo es una tarea común para los desarrolladores de aplicaciones:necesitan predecir qué usuarios continuarán usando la aplicación (positivo) o dejarán de usar la aplicación (negativo). Sin embargo, cuando un usuario se da de baja, los desarrolladores pierden los datos del usuario porque tienen que eliminar por completo los datos relacionados con ese usuario de acuerdo con la política de privacidad para proteger la información personal.

    Según el autor principal Takashi Ishida de RIKEN AIP, "Los métodos de clasificación anteriores no podían hacer frente a la situación en la que no se disponía de datos negativos, pero hemos hecho posible que las computadoras aprendan solo con datos positivos, siempre que tengamos una puntuación de confianza para nuestros datos positivos, construido a partir de información como la intención de compra o la tasa de actividad de los usuarios de la aplicación. Usando nuestro nuevo método, podemos permitir que las computadoras aprendan un clasificador solo a partir de datos positivos equipados con confianza ".

    Ishida propuso, junto con el investigador Gang Niu de su grupo y el líder del equipo Masashi Sugiyama, que permiten que las computadoras aprendan bien agregando la puntuación de confianza, que corresponde matemáticamente a la probabilidad de que los datos pertenezcan a una clase positiva o no. Tuvieron éxito en desarrollar un método que puede permitir que las computadoras aprendan un límite de clasificación solo a partir de datos positivos e información sobre su confianza (confiabilidad positiva) frente a los problemas de clasificación del aprendizaje automático que dividen los datos de manera positiva y negativa.

    Para ver qué tan bien funcionó el sistema, lo usaron en un conjunto de fotos que contiene varias etiquetas de artículos de moda. Por ejemplo, eligieron "camiseta, "como clase positiva y otro elemento, p.ej., "sandalia", como la clase negativa. Luego, agregaron una puntuación de confianza a las fotos de la "camiseta". Descubrieron que sin acceder a los datos negativos (por ejemplo, fotos de "sandalia"), en algunos casos, su método era tan bueno como un método que implica el uso de datos positivos y negativos.

    Según Ishida, "Este descubrimiento podría ampliar la gama de aplicaciones en las que se puede utilizar la tecnología de clasificación. Incluso en campos en los que se ha utilizado activamente el aprendizaje automático, Nuestra tecnología de clasificación podría usarse en situaciones nuevas en las que solo se pueden recopilar datos positivos debido a la regulación de datos o las limitaciones comerciales. En el futuro cercano, Esperamos utilizar nuestra tecnología en varios campos de investigación. como el procesamiento del lenguaje natural, visión por computador, robótica, y bioinformática ".


    © Ciencia https://es.scienceaq.com