• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  Science >> Ciencia >  >> Otro
    El estudio del nuevo método utilizado para preservar la privacidad con datos del censo de EE. UU. sugiere que la precisión se ha visto afectada
    Error cuadrático medio estimado (RMSE) para recuentos de población de un grupo racial o étnico, en cada nivel geográfico. El RMSE cuantifica la magnitud promedio del error para una geografía determinada para una unidad geográfica particular. Los triángulos para RMSE indican que el error cuadrático medio estimado fue negativo y, por lo tanto, se fijó en cero. Crédito:Avances científicos (2024). DOI:10.1126/sciadv.adl2524

    Un pequeño equipo de politólogos, estadísticos y científicos de datos de la Universidad de Harvard, la Universidad de Nueva York y la Universidad de Yale descubrió que al cambiar a un nuevo método para proteger mejor la privacidad, el Departamento del Censo de EE. UU. ha introducido factores que reducen la precisión en algunos casos. .



    En su artículo publicado en la revista Science Advances , el grupo describe cómo analizaron un archivo proporcionado por los funcionarios del censo para medir la precisión de los datos del censo disponibles públicamente y sus resultados.

    Antes del censo de EE. UU. de 2020, los funcionarios de la Oficina del Censo de EE. UU., preocupados por la privacidad de las personas que brindan respuestas al censo, optaron por cambiar el método mediante el cual garantizaban la seguridad de los datos.

    El antiguo método se llamaba "intercambio". Implicaba intercambiar datos de personas que vivían en una cuadra de una ciudad con personas de otra cuadra, evitando así que las personas fueran identificadas en función de sus datos. El nuevo método se llama "privacidad diferencial" e implica agregar lo que la Oficina describe como "ruido" a cada dato que se recopila.

    En este nuevo esfuerzo, el equipo de investigación no pudo encontrar ningún caso de una entidad externa que realizara una investigación para determinar si el nuevo método realmente proporcionaba más privacidad o si los datos procesados ​​eran más o menos precisos que cuando se utilizó el intercambio. Entonces comenzaron uno propio.

    El estudio comenzó cuando el equipo de investigación pidió a la Oficina del Censo que les diera acceso a lo que se llama el archivo de medición de ruido (NMF), el que se utilizó para el censo de 2020. La Oficina negó la solicitud, lo que llevó al equipo a demandarlos. Finalmente, la demanda fue retirada cuando la Oficina acordó darle al equipo el NMF asociado con el censo mucho más pequeño de 2010, uno que se llevó a cabo como una forma de probar el nuevo método e implicó tanto intercambio como diferenciación.

    Luego, los investigadores analizaron ese archivo como una forma de estudiar el impacto en la precisión del cambio al nuevo sistema. Al hacerlo, descubrieron que, en general, los dos sistemas proporcionaban aproximadamente la misma precisión a gran escala. Pero también encontraron evidencia de una reducción en la precisión a nivel de bloque de un tipo que podría afectar negativamente a las minorías y las poblaciones multirraciales.

    Más información: Christopher T. Kenny et al, Evaluación del sesgo y el ruido inducido por los métodos de protección de la privacidad de la Oficina del Censo de EE. UU., Science Advances (2024). DOI:10.1126/sciadv.adl2524

    Información de la revista: Avances científicos

    © 2024 Red Ciencia X




    © Ciencia https://es.scienceaq.com