Crédito:CC0 Public Domain
Dos nuevos algoritmos podrían ayudar a que los sistemas de alerta temprana de terremotos le otorguen unos segundos adicionales para caer, cubrir, y agárrate antes de que el suelo empiece a temblar.
Informáticos de la Universidad de California, Riverside ha desarrollado dos algoritmos que mejorarán el monitoreo de terremotos y ayudarán a los agricultores a proteger sus cultivos de insectos peligrosos. o controlar la salud de los pollos y otros animales. Los algoritmos detectan patrones en enormes conjuntos de datos rápidamente, con menos potencia de cálculo y menor costo, que otros métodos y se han utilizado para mejorar la detección de terremotos, monitorear el insecto vector psílido asiático de los cítricos, y evaluar el comportamiento alimentario de los pollos.
Big data, grandes problemas
Sensores como sensores sísmicos, que registra automáticamente los eventos que suceden repetidamente durante un período de tiempo, tener un problema. Recopilan tanta información que es difícil detectar patrones. El análisis de series de tiempo soluciona esto buscando otros ejemplos de una secuencia de muestra dentro de un conjunto de datos, usualmente usando unidades de procesamiento de gráficos, o GPU. Pero para conjuntos de datos muy grandes, esto se vuelve poco práctico porque requiere demasiadas GPU, lo que aumenta el costo.
Zachary Zimmerman, estudiante de doctorado en informática en la Facultad de Ingeniería Marlan and Rosemary Bourns, se basó en un algoritmo desarrollado previamente por el coautor y profesor de informática Eamonn Keogh para manejar conjuntos de datos extremadamente grandes y lo ejecutó en 40 GPU alojadas en la nube de Amazon Web Services.
El algoritmo llamado SCAMP, clasificó casi dos años de registros sísmicos de la falla de Parkfield en California, un segmento de la falla de San Andrés ubicado cerca de la ciudad de Parkfield, en solo 10 horas, a un costo razonable de alrededor de $ 300, y descubrió 16 veces más terremotos de los que se conocían anteriormente.
"Es difícil enfatizar demasiado lo escalable que es este algoritmo, "Keogh dijo." Para demostrar esto, hicimos un quintillón, es decir, 1 seguido de 18 ceros, comparaciones por pares de fragmentos de datos de terremotos. Nada más en la literatura se encuentra dentro de una décima parte de un porcentaje de ese tamaño ".
Identificar terremotos no siempre es fácil
"El problema más fundamental en sismología es identificar terremotos. Ha habido una serie de mejoras metodológicas por parte de los sismólogos que aplican estrategias de la informática para buscar patrones similares, "dijo el coautor Gareth Funning, profesor asociado de sismología. "El gran avance aquí es que el conjunto de datos que puede administrar está mucho más grande. Cuando miramos los datos sísmicos, solíamos pensar que lo estábamos haciendo bien comparando todo en una ventana de tiempo de dos meses ".
Otros métodos de detección de terremotos requieren que el algoritmo encuentre secuencias que coincidan con un terremoto conocido. En cambio, el método UC Riverside compara todo dentro de un tiempo determinado y, por lo tanto, puede identificar terremotos que no necesariamente coinciden con uno dado como modelo.
Por ejemplo, su análisis de los datos de Parkfield descubrió sutiles, terremotos de baja frecuencia debajo de la falla de San Andrés. Secuencias de estos terremotos, también conocidos como temblores no volcánicos, acompañar profundo, movimientos lentos de las placas tectónicas.
Las ráfagas de terremotos de baja frecuencia han precedido ocasionalmente a terremotos masivos, como el de Japón hace 10 años. Una mejor detección de terremotos de baja frecuencia podría ayudar a mejorar los pronósticos de los terremotos más grandes y también ayudaría a los científicos a monitorear mejor los movimientos de las placas tectónicas.
Desde terremotos hasta pollos y plagas de insectos.
El algoritmo SCAMP también puede detectar plagas agrícolas dañinas. Keogh adjuntó sensores que registraron los movimientos de los insectos mientras chupaban los jugos de las hojas y usó el algoritmo para identificar el psílido asiático de los cítricos. el insecto responsable de devastar los cultivos de cítricos al propagar la bacteria que causa Huanglongbing, o enfermedad del enverdecimiento de los cítricos. También usó el algoritmo para analizar un conjunto de datos de acelerómetros, que miden varios tipos de movimientos, unido a los pollos durante un período de días. Luego, SCAMP identificó patrones específicos relacionados con la alimentación y otros comportamientos.
SCAMP tiene una limitación, sin embargo.
"SCAMP requiere que tenga la serie de tiempo completa antes de realizar la búsqueda. En los casos de extracción de datos sismológicos históricos, tenemos eso. O en un estudio científico, podemos hacer funcionar el pollo durante 10 horas y analizar los datos después del hecho, "dijo el coautor Philip Brisk, profesor asociado de informática y consejero de doctorado de Zimmerman. "Pero con la transmisión de datos directamente desde el sensor, no queremos esperar 10 horas. Queremos poder decir que algo está sucediendo ahora ".
Detección de terremotos en tiempo real más rápida
Zimmerman usó los mil millones de puntos de datos, llamado perfil de matriz, generado por el análisis de SCAMP de los datos de falla de Parkfield para entrenar un algoritmo que llamó LAMP. LAMP compara los datos de transmisión con ejemplos que ha visto antes para seleccionar los datos más relevantes a medida que salen del sensor.
"Tener el perfil de matriz disponible para usted en el sensor significa que puede saber inmediatamente qué es importante y qué no. Puede hacer todas sus comprobaciones en tiempo real porque solo está mirando a través de los bits importantes, "Dijo Zimmerman.
La capacidad de interpretar más rápidamente los datos sísmicos podría mejorar los sistemas de alerta de terremotos que ya existen.
"Con alerta temprana de terremotos, está tratando de detectar cosas en las estaciones de monitoreo y luego reenviar la información a un sistema central que evalúa si es un gran terremoto o no, ", dijo Funning." Una configuración como esta podría potencialmente hacer mucho de ese trabajo de discriminación antes de que se transmita al sistema. Podría reducir el tiempo de los cálculos necesarios para determinar que se está produciendo un evento dañino, comprando a la gente un par de segundos extra para que caigan, cubrir, y espera ".
"Un par de segundos es enorme en la alerta temprana de terremotos, "añadió.
El documento sobre SCAMP, "Matrix Profile XIV:Escalar el descubrimiento de motivos de series temporales con GPU para romper un trillón de comparaciones por pares al día y más allá, "se presentó en el Simposio ACM sobre Computación en la Nube del 20 al 23 de noviembre, 2019 en Santa Cruz. Los autores son Zachary Zimmerman, Kaveh Kamgar, Nader Shakibay Senobari, Brian Crites, Gareth Funning, Philip Brisk y Eamonn Keogh.
El artículo sobre LAMP, "Perfil de matriz XVIII:minería de series de tiempo frente a corrientes de rápido movimiento utilizando un perfil de matriz aproximado aprendido, "se presentó en la Conferencia Internacional IEEE sobre Minería de Datos de 2019 celebrada en Beijing a principios de noviembre. Los autores son Zachary Zimmerman, Nader Shakibay Senobari, Gareth Funning, Evangelos Papalexakis, Samet Oymak, Philip Brisk, y Eamonn Keogh.