• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Big data utilizado para predecir el futuro

    Crédito:CC0 Public Domain

    La tecnología avanza a pasos agigantados, y con eso, la información con la que la sociedad opera a diario. Sin embargo, el volumen de datos debe organizarse, analizados y correlacionados para predecir ciertos patrones. Esta es una de las principales funciones de lo que se conoce como Big Data.

    Investigadores del grupo de investigación KIDS del Departamento de Informática y Análisis Numérico de la Universidad de Córdoba lograron mejorar los modelos que predicen varias variables de forma simultánea en función del mismo conjunto de variables de entrada. reduciendo así el tamaño de los datos necesarios para un pronóstico preciso. Un ejemplo de esto es un método que predice varios parámetros relacionados con la calidad del suelo en base a un conjunto de variables como cultivos plantados, labranza y uso de plaguicidas.

    "Cuando se trata de un gran volumen de datos, hay dos soluciones. O aumenta el rendimiento de la computadora, que es muy caro, o reduce la cantidad de información necesaria para que el proceso se realice correctamente, "dice el investigador Sebastián Ventura, uno de los autores del artículo de investigación.

    Al construir un modelo predictivo, Los resultados fiables dependen de dos cuestiones:el número de variables que entran en juego y el número de ejemplos introducidos en el sistema. Con la idea de que menos es más el estudio ha podido reducir el número de ejemplos al eliminar aquellos que son redundantes o "ruidosos, y que, por tanto, no aportan ninguna información útil para la creación de un mejor modelo predictivo.

    Como Oscar Reyes, el autor principal de la investigación, señala que "hemos desarrollado una técnica que puede decirle qué conjunto de ejemplos necesita para que el pronóstico no solo sea confiable, sino que incluso podría ser mejor". En algunas bases de datos, de los 18 analizados, pudieron reducir la cantidad de información en un 80 por ciento sin afectar el rendimiento predictivo, lo que significa que se utilizó menos de la mitad de los datos originales. Todo esto, dice Reyes, "significa ahorrar energía y dinero en la construcción de un modelo, ya que se requiere menos potencia de cálculo ". Además, también significa ahorrar tiempo, que es interesante para aplicaciones que funcionan en tiempo real, ya que "no tiene sentido que un modelo tarde media hora en ejecutarse si necesita una predicción cada cinco minutos".

    Sistemas que predicen varias variables relacionadas simultáneamente, conocidos como modelos de regresión de múltiples salidas, están ganando una importancia más notable debido al amplio abanico de aplicaciones que podrían analizarse bajo este paradigma de aprendizaje automático, como los relacionados con la asistencia sanitaria, calidad del agua, sistemas de refrigeración para edificios y estudios medioambientales.


    © Ciencia https://es.scienceaq.com