El profesor de informática de NUS Ooi Beng Chin y director del Instituto de sistemas inteligentes de NUS (de pie, tercero desde la derecha) dirigió el equipo de NUS que desarrolló Apache SINGA. Crédito:NUS
Un equipo de investigadores de la Universidad Nacional de Singapur (NUS) ha colocado a Singapur en el mapa global de la inteligencia artificial (IA) y el análisis de big data. Su proyecto de código abierto, llamado Apache SINGA, "se graduó" de Apache Incubator el 16 de octubre de 2019 y ahora es el primer proyecto de nivel superior (TLP) del sudeste asiático de la Apache Software Foundation, la comunidad de software de código abierto más grande del mundo.
Ser reconocido como TLP no es poca cosa, ya que Apache SINGA ahora se une a las filas de las principales herramientas de código abierto, como Apache HTTP Server y Apache Kafka. Si bien es posible que el nombre no suene inmediatamente, Apache Kafka impulsa las soluciones de big data en Airbnb, LinkedIn, Netflix, PayPal, Spotify y muchas otras corporaciones. El servidor HTTP Apache es el servidor web más popular del mundo y actualmente sirve al 29 por ciento de todos los sitios web activos en Internet.
Dirigido por el profesor Ooi Beng Chin, Apache SINGA fue iniciado por el Grupo de Investigación del Sistema de Base de Datos de la Escuela de Computación NUS junto con la Universidad de Zhejiang y NetEase en 2014. El prototipo se envió a Apache Incubator en marzo de 2015, y el primer lanzamiento oficial se realizó en octubre de 2015. Desde entonces, los investigadores de NUS han recibido el apoyo de la National Research Foundation Singapore, Ministerio de Educación, y la Agencia para la Ciencia, Tecnología e Investigación.
El profesor Ooi dijo:"Vimos una creciente demanda de plataformas de aprendizaje profundo y máquinas en 2012, pero había una falta de plataformas distribuidas eficientes. La graduación es una marca de reconocimiento para Apache SINGA, Pero esto es solo el principio. Esperamos que Apache SINGA pueda tener un impacto en el aprendizaje profundo de la misma manera que lo hicieron los servidores HTTP Apache para los servidores de sitios web ".
El aprendizaje profundo es un subconjunto del aprendizaje automático que busca aprovechar las redes neuronales artificiales para generar información significativa a partir de grandes cantidades de datos. Si bien el aprendizaje automático generalmente requiere que los humanos proporcionen datos estructurados, el aprendizaje profundo puede estructurar datos sin procesar por sí mismo. Un ejemplo sería identificar la imagen de un gato; el aprendizaje automático requerirá la participación humana para definir que un gato tiene características como bigotes, orejas y patas puntiagudas. El aprendizaje profundo analizará múltiples imágenes de gatos a través de varios algoritmos para determinar todas las características por sí mismo, simulando un cerebro artificial.
Sin embargo, la limitación del aprendizaje profundo es que requiere una cantidad astronómica de datos que, a su vez, necesita mucha potencia computacional. Un sistema centralizado típico requeriría una sola supercomputadora para procesar toda esta información, lo cual no es una opción para la mayoría de las organizaciones. El enfoque de sistema distribuido de Apache SINGA ayuda a superar la necesidad de una sola supercomputadora, ya que distribuye la carga de trabajo entre una gran cantidad de computadoras normales.
Apache SINGA actualmente impulsa aplicaciones en múltiples sectores, incluido el cuidado de la salud, Bancos y finanzas, desarrollo de software y ciberseguridad. Una de esas aplicaciones es FoodLG, que utiliza el reconocimiento de imágenes para identificar un plato basado en la foto cargada por el usuario final.Cinco hospitales en Singapur están utilizando actualmente diferentes versiones de FoodLG para promover una vida saludable y facilitar el manejo de enfermedades como la diabetes, hipertensión y colesterol alto.
El Hospital Universitario Nacional (NUH) y el Hospital General de Singapur también están aprovechando Apache SINGA para analizar imágenes de resonancia magnética y rayos X para mejorar la identificación de problemas de salud. Además, NUH utiliza modelos entrenados en Apache SINGA para modelar la progresión de la enfermedad y modelar la readmisión de pacientes. En el ámbito de la ciberseguridad, SecureAge está desarrollando modelos de aprendizaje profundo de detección de malware utilizando Apache SINGA para identificar el malware con mayor precisión, así como identificar nuevos tipos de malware basados en datos anteriores. Bancos locales, por otra parte, también están utilizando Apache SINGA para desarrollar y entrenar modelos para el modelado de riesgos y resolver el cumplimiento de las normas contra el lavado de dinero.
El siguiente paso para Apache SINGA es mejorar su sistema para que incluso los que no son expertos en IA puedan usarlo y prepararse para la era de 5G optimizándolo para que se ejecute en dispositivos periféricos.