El equipo rompe el récord mundial de rapidez, entrenamiento preciso de IA

Diagrama que muestra la transmisión de datos de un modelo de 5 capas. Crédito:HKBU

Investigadores de la Universidad Bautista de Hong Kong (HKBU) se han asociado con un equipo de Tencent Machine Learning para crear una nueva técnica para entrenar máquinas de inteligencia artificial (IA) más rápido que nunca y manteniendo la precisión.

Durante el experimento, El equipo entrenó dos populares redes neuronales profundas llamadas AlexNet y ResNet-50 en solo cuatro minutos y 6.6 minutos respectivamente. Previamente, el tiempo de entrenamiento más rápido fue de 11 minutos para AlexNet y 15 minutos para ResNet-50.

AlexNet y ResNet-50 son redes neuronales profundas creadas en ImageNet, un conjunto de datos a gran escala para el reconocimiento visual. Una vez entrenado, el sistema pudo reconocer y etiquetar un objeto en una foto determinada. El resultado es significativamente más rápido que los registros anteriores y supera a todos los demás sistemas existentes.

El aprendizaje automático es un conjunto de enfoques matemáticos que permiten a las computadoras aprender de los datos sin ser programados explícitamente por humanos. Los algoritmos resultantes se pueden aplicar a una variedad de tareas de reconocimiento visual y de datos utilizadas en la IA.

El equipo de HKBU está compuesto por el profesor Chu Xiaowen y Ph.D. estudiante Shi Shaohuai del Departamento de Ciencias de la Computación. El profesor Chu dijo:"Hemos propuesto un nuevo método de entrenamiento optimizado que mejora significativamente el mejor resultado sin perder precisión. En el entrenamiento de IA, los investigadores se esfuerzan por entrenar sus redes más rápido, pero esto puede provocar una disminución de la precisión. Como resultado, entrenar modelos de aprendizaje automático a alta velocidad mientras se mantiene la exactitud y precisión es un objetivo vital para los científicos ".

El profesor Chu dijo que el tiempo necesario para entrenar las máquinas de IA se ve afectado tanto por el tiempo de computación como por el tiempo de comunicación. El equipo de investigación logró avances en ambos aspectos para crear este logro sin precedentes.

Esto incluyó la adopción de un método computacional más simple conocido como FP16 para reemplazar el más tradicional, FP32, haciendo que el cálculo sea mucho más rápido sin perder precisión. Como el tiempo de comunicación se ve afectado por el tamaño de los bloques de datos, el equipo ideó una técnica de comunicación llamada "fusión tensorial, "que combina datos más pequeños en datos más grandes, optimizando el patrón de transmisión y, por lo tanto, mejorando la eficiencia de la comunicación durante el entrenamiento de IA.

Esta nueva técnica se puede adoptar en la clasificación de imágenes a gran escala, y también se puede aplicar a otras aplicaciones de IA, incluida la traducción automática; procesamiento del lenguaje natural (PNL) para mejorar las interacciones entre el lenguaje humano y las computadoras; análisis de imágenes médicas; y juegos de batalla multijugador en línea.

Por qué algunas disputas de Wikipedia no se resuelven:el estudio identifica las razones, ofrece herramientas predictivas

Los investigadores descubren fallas de seguridad en dispositivos de almacenamiento de datos ampliamente utilizados

Electrónica