• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Otro
    Sistemas estadísticos suizos mejorados por big data

    Crédito:CC0 Public Domain

    Se ha recopilado un gran volumen de datos digitales, almacenados y compartidos en los últimos años a partir de fuentes como las redes sociales, sistemas de geolocalización e imágenes aéreas de drones y satélites, dando a los investigadores muchas formas nuevas de estudiar la información y descifrar nuestro mundo. En Suiza, la Oficina Federal de Estadística (FSO) se ha interesado por la revolución del big data y las posibilidades que ofrece para generar estadísticas predictivas en beneficio de la sociedad.

    Los métodos convencionales como censos y encuestas siguen siendo el punto de referencia para generar indicadores socioeconómicos en el municipio, nivel cantonal y nacional. Pero estos métodos ahora se pueden complementar con secundarios, en su mayoría datos preexistentes, de fuentes como suscripciones a teléfonos móviles y tarjetas de crédito. De acuerdo con la Estrategia de Innovación de Datos 2017 de FSO, "El objetivo de la innovación de datos es mejorar la calidad, alcance y rentabilidad de los productos estadísticos y para reducir la carga de respuesta sobre los hogares y las empresas ".

    Datos anonimizados

    Contra la cortina, un equipo de científicos del Laboratorio de Relaciones Humano-Medioambientales en Sistemas Urbanos (HERUS) de la EPFL llevó a cabo un estudio pionero sobre usos novedosos de los datos en poder de las compañías de seguros. La empresa colaboradora líder del laboratorio, La Mobilière, proporcionó datos anónimos de cientos de miles de asegurados. Estos datos incluyeron factores como la edad, código postal residencial, propiedad de automóvil y vivienda, y situación laboral.

    "Queríamos ver si podíamos usar estos datos para predecir indicadores socioeconómicos específicos, aquellos que podrían darnos una mejor imagen de la calidad de las áreas urbanas de Suiza. Una gran ventaja de los datos en poder de las aseguradoras, siempre que estén dispuestos para compartirlo, es que son baratos de usar, como ya existen, y las encuestas anuales se pueden realizar sin costo adicional, "dice Emanuele Massaro, un autor principal del estudio, que fue publicado en MÁS UNO el 3 de marzo.

    Usando técnicas de minería de datos, el equipo de investigación extrajo la información relevante y la agregó para cubrir las 170 ciudades suizas más pobladas. En todo, obtuvieron casi 600, 000 perfiles, cada uno identificado por un código único. "El conjunto de datos de La Mobilière es muy completo; contiene una amplia gama de información que nos permitió factorizar más de 30 variables, que utilizamos principalmente para seleccionar aquellas variables que mejor se ajustan a cada indicador socioeconómico, "dice Lorenzo Donadio, estudiante de maestría en ciencias e ingeniería ambiental en EPFL y primer autor del estudio.

    Un modelo de regresión espacial

    Los científicos desarrollaron un modelo de regresión espacial para predecir con precisión doce variables en seis categorías:población, transporte, trabaja, espacio y región, alojamiento, y la economía. "Por supuesto, nuestras predicciones no pueden reemplazar los censos oficiales, pero pueden servir como señales anuales. También queríamos mostrar que los conjuntos de datos de las aseguradoras contienen una gran cantidad de información socialmente relevante, más allá de la que utilizan para marketing e investigación de mercado, y que las aseguradoras deberían considerar trabajar más de cerca con los investigadores. "dice Massaro.

    El modelo estadístico del equipo se desarrolló únicamente con fines de investigación y no tiene una aplicación práctica como tal. Podría utilizarse para ayudar a orientar a los responsables de la formulación de políticas, pero aún se necesitan datos censales regulares. A los datos de La Mobilière les falta cierta información, como para los jóvenes menores de 18 años, pero son, sin embargo, representativos de una gran parte de la población. "Nuestro modelo podría ser utilizado por los responsables de la formulación de políticas de la ciudad y las oficinas de estadística del gobierno, que podrían incorporar este tipo de información en sus esfuerzos de modernización. Los conjuntos de datos de las aseguradoras son muy granulares porque contienen información muy específica sobre sus clientes, "dice Massaro.


    © Ciencia https://es.scienceaq.com