Aplicaciones de caolín. Crédito:Murthy Jatavallabhula et al.
Como la mayoría de los entornos del mundo real son tridimensionales, Idealmente, los modelos de aprendizaje profundo diseñados para analizar videos o completar tareas en entornos del mundo real deberían estar entrenados en datos 3-D. Herramientas tecnológicas como robots, vehículos autónomos, teléfonos inteligentes, y otros dispositivos están generando actualmente una cantidad creciente de datos 3-D que eventualmente podrían ser procesados por algoritmos de aprendizaje profundo.
Hasta ahora, sin embargo, entrenar algoritmos de aprendizaje profundo en esta gran cantidad de datos 3-D ha sido relativamente difícil, ya que las herramientas y plataformas necesarias solo son accesibles para algunos investigadores de inteligencia artificial (IA). Para abordar esta falta de herramientas fácilmente disponibles, un equipo de investigadores de NVIDIA ha creado recientemente Kaolin, una biblioteca de código abierto de PyTorch destinada a promover y facilitar la investigación de aprendizaje profundo en 3-D.
"En la actualidad, no existe una sola biblioteca de software de código abierto que admita múltiples representaciones de datos 3-D, trabajos multiples, y criterios de evaluación, "Krishna Murthy Jatavallabhula, uno de los investigadores que realizó el estudio, dijo a TechXplore. "Decidimos abordar esta brecha en la literatura creando Kaolin, la primera biblioteca integral de aprendizaje profundo en 3-D ".
Caolín, la biblioteca PyTorch presentada por Jatavallabhula y sus colegas, contiene una variedad de herramientas para construir arquitecturas de aprendizaje profundo que pueden analizar datos 3-D, que son a la vez eficientes y fáciles de usar. También permite a los investigadores cargar, preproceso, y manipular datos 3-D antes de que se utilicen para entrenar algoritmos de aprendizaje profundo.
Kaolin incluye varios módulos gráficos para editar imágenes en 3-D, con funciones como renderizado, Encendiendo, sombreado y deformación de la vista. Es más, admite una amplia gama de funciones de pérdida y métricas de evaluación, permitiendo a los investigadores evaluar fácilmente sus algoritmos de aprendizaje profundo.
Crédito:Murthy Jatavallabhula et al.
"Típicamente, Los investigadores de aprendizaje profundo 3-D necesitan escribir mucho código repetitivo para sus proyectos de investigación, "Jatavallabhula explicó." Con Kaolin, sin embargo, los investigadores solo necesitan implementar las partes novedosas de su proyecto, como Kaolin empaqueta un conjunto completo de utilidades para la carga de datos, conversión y evaluación ".
El caolín es una herramienta valiosa tanto para los desarrolladores con experiencia en el desarrollo de modelos de aprendizaje profundo como para aquellos que recién están comenzando. Dentro de la biblioteca, De hecho, Los desarrolladores también pueden encontrar varias arquitecturas de vanguardia que pueden utilizar como punto de partida o como fuente de inspiración para sus propios modelos.
"Si bien los investigadores activos de aprendizaje profundo en 3-D ven al caolín como un medio para acelerar su investigación, los recién llegados a este campo están recurriendo a Kaolin para tener una idea de por dónde empezar, "Dijo Jatavallabhula.
En el futuro, la biblioteca de código abierto presentada por estos investigadores en NVIDIA podría ayudar a acelerar la investigación de aprendizaje profundo en 3-D, ayudar a los desarrolladores a crear nuevas arquitecturas de IA, así como en capacitarlos y evaluarlos. Mientras tanto, Jatavallabhula y sus colegas planean trabajar para extender Kaolin y mejorar aún más sus capacidades.
"Nuestro plan es agregar más modelos de aprendizaje profundo a nuestro zoológico de modelos (colección de modelos de IA) y expandir nuestra cobertura a un conjunto más amplio de aplicaciones, como autos autónomos y agentes incorporados que necesitan aprendizaje en 3-D, ", Dijo Jatavallabhula." En resumen, planeamos hacer de Kaolin una plataforma integral para la investigación de aprendizaje profundo en 3-D ".
© 2019 Science X Network