Crédito:Unsplash/CC0 Dominio público
Se ha desarrollado un nuevo modelo básico denominado RingMo para mejorar la precisión de la interpretación de imágenes de teledetección, según el Instituto de Investigación de Información Aeroespacial (AIR) de la Academia de Ciencias de China (CAS).
El estudio titulado "RingMo:A Remote Sensing Foundation Model with Masked Image Modeling" se publicó en IEEE Transactions on Geoscience and Remote Sensing .
Las imágenes de teledetección se aplican en campos como la clasificación y la detección de cambios, y los enfoques de aprendizaje profundo han contribuido al rápido desarrollo de la interpretación de imágenes de teledetección. El paradigma de capacitación más utilizado es el uso de modelos preentrenados de ImageNet para procesar datos de detección remota para tareas específicas.
Sin embargo, existen problemas, como una brecha de dominio entre las escenas naturales y de teledetección y la poca capacidad de generalización de los modelos de teledetección. Por lo tanto, es necesario desarrollar un modelo básico con una representación general de características de teledetección. Dado que hay disponible una gran cantidad de datos sin etiquetar, el método autosupervisado es mejor que el método completamente supervisado en la detección remota.
El estudio tiene como objetivo proponer un marco modelo de base de teledetección, que puede aprovechar los beneficios del aprendizaje autosupervisado generativo para imágenes de teledetección. RingMo presenta un conjunto de datos a gran escala construido mediante la recopilación de 2 millones de imágenes de detección remota de plataformas aéreas y satelitales, que cubren múltiples escenas y objetos en todo el mundo. Además, el método de entrenamiento del modelo básico de detección remota está diseñado para objetos densos y pequeños en escenas complicadas de detección remota.
RingMo es el primer modelo base generativo para datos de teledetección multimodal. En el futuro, el modelo se puede aplicar a la reconstrucción 3D, la construcción residencial, el transporte, la conservación del agua, la protección del medio ambiente y otros campos. Red de inicio de atención mutua desarrollada para responder preguntas visuales de teledetección