Más allá del cifrado:proteger la privacidad del consumidor mientras se mantienen precisos los resultados de la encuesta

Crédito:CC0 Public Domain

No es de extrañar que varias organizaciones recopilen continuamente datos de consumidores, incluidos los gobiernos locales, agencias de marketing y empresas de redes sociales. Estas organizaciones garantizan el anonimato y la confidencialidad al recopilar estos datos, sin embargo, Las leyes de privacidad de datos existentes no garantizan que no se produzcan violaciones de datos. Según un informe reciente, Más de 2, 000 violaciones de datos confirmadas ocurrieron solo en 2019, con 34% de los ejecutados por actores internos como empleados. Para agregar a eso, Las agencias municipales y estatales recopilan datos confidenciales que la ley les exige compartir con el público, cortesía de los movimientos de Datos Abiertos y la Ley de Libertad de Información.

Las leyes de privacidad de datos requieren cifrado y, en algunos casos, transformar los datos originales en "datos protegidos" antes de que se entreguen a terceros. Pero para investigadores como Matthew Schneider, Doctor., profesor asistente de Ciencias de la Decisión y Sistemas de Información de Gestión en la Facultad de Negocios LeBow de la Universidad de Drexel, esto no es adecuado.

"El cifrado definitivamente ayuda, pero no evita una violación de datos, ", dijo." Es similar a proteger su contraseña de correo electrónico. Un actor interno con acceso a la clave de cifrado podría causar fácilmente una violación de datos. Es más conservador desde una perspectiva de riesgo asumir que todos los datos eventualmente saldrán y deberían transformarse antes de compartirlos en cualquier lugar dentro de la organización ".

En un artículo reciente publicado en Revista de análisis de marketing , Schneider y Dawn Iacobucci, Doctor., de la Universidad de Vanderbilt, propuso una nueva metodología que altera permanentemente los conjuntos de datos de las encuestas para proteger la privacidad de los consumidores —cuando se comparten los datos— al tiempo que conserva un nivel de precisión razonable para estos conjuntos de datos.

Según los autores, Los datos de la encuesta a menudo se mantienen dentro de las organizaciones y se utilizan para fines que van más allá del motivo original para recopilar los datos. "Las bases de datos y la información de los clientes se han convertido en un activo contemporáneo que hace que un negocio sea atractivo para otro al forjar alianzas, ", Dijo Schneider." Incluso las empresas con altos estándares de seguridad de datos pueden encontrar un desafío para proteger la privacidad de los datos de los consumidores ".

Otro menos común, pero demasiado real amenaza, según los autores, Son casos en los que los empleados han tomado ilegalmente datos de sus antiguas empresas para ocupar un puesto con un nuevo empleador, por razones que van desde obtener una impresión favorable con la nueva empresa, a perjudicar a la antigua empresa, incluso tener que facilitar los datos como condición de la oferta de trabajo.

Para Schneider, la solución para cumplir las promesas de privacidad de los datos resulta ser tecnológica.

"Los datos de las encuestas se utilizan cada vez más para análisis a nivel de encuestados, como en la vinculación con otros conjuntos de datos patentados, y las promesas de privacidad pueden no estar garantizadas en la miríada de usos posteriores de los datos, ", dijo Schneider." La confidencialidad no garantiza el anonimato. Se necesitan alrededor de tres o cuatro preguntas cuidadosamente formuladas en una encuesta para identificar de manera única a cualquier persona ".

En el papel, los autores analizaron un conjunto de datos de encuestas que fue recopilado en 2015 por la ciudad de Austin, Texas y lanzado al público tras un movimiento de Datos Abiertos. Otras ciudades tienen movimientos similares, incluyendo Nueva York y Filadelfia.

"Hay muchos riesgos de privacidad en los datos abiertos, ya que no hacen la privacidad tan bien como el gobierno federal que tiene el gran presupuesto y los recursos para contratar estadísticos, economistas o informáticos para abordar este problema tecnológico, ", dijo Schneider." La protección a menudo depende de cómo se utilizan los datos ".

La ciudad de Austin administró una encuesta a 2, 614 estadounidenses de origen asiático que viven en la ciudad para explorar las necesidades de salud y servicios de una de las poblaciones de más rápido crecimiento de la ciudad con el objetivo de crear niveles más altos de participación comunitaria, políticas e identificar recursos para abordar las necesidades de la comunidad asiático-americana. Los funcionarios de Austin publicaron sus conjuntos de datos, según sea necesario, para que estén fácilmente disponibles para los usuarios.

En un conjunto de datos de la encuesta, a cada encuestado se le preguntó su origen étnico, que tenía 32 categorías; la edad, que tenía 77 categorías; código postal, que tenía 61 categorías; y género.

"Casi todo el mundo es identificable con estas cuatro variables, algunas más que otras, ", dijo Schneider." Una vez que los identifica, esta encuesta reveló otras respuestas sensibles como la situación laboral, afiliación religiosa, ingresos del hogar, asequibilidad de la vivienda y muchas preguntas de actitud. "

Similar, La ciudad de Nueva York experimentó un problema de datos abiertos con la Comisión de taxis y limusinas de la ciudad de Nueva York, donde 124 millones de rutas de conducción se podían rastrear hasta la dirección de un conductor.

Un desafío importante al considerar las metodologías para alterar los datos de los participantes de manera efectiva es hacerlo de una manera que no cambie en gran medida la precisión de los resultados de la encuesta. La metodología propuesta por los autores, se basó en una técnica que se encuentra en las aplicaciones de secuenciación genómica que fue capaz de disfrazar la identidad de los consumidores manteniendo la precisión de los conocimientos dentro del 5%.

"Nuestro método esencialmente 'mezclaría' los datos demográficos en un conjunto de datos de encuestas, ", dijo Schneider." Pero, a diferencia de los métodos anteriores, el nuestro solo baraja datos cuando mantiene las correlaciones entre variables importantes que son esenciales para los analistas. Los datos protegidos se simulan a nivel de consumidor, pero siguen siendo valiosos para el usuario final. Si se publicara este conjunto de datos, entonces sólo se conocerían las percepciones de la organización ".

El papel, "Protección de datos de encuestas a nivel de consumidor, "fue publicado en el Revista de análisis de marketing y está disponible en este enlace. Los detalles sobre la nueva metodología se incluyen en el documento.

¿No tienes webcam? New Mevo puede llenar el vacío y transmitir a Facebook, Twitter y YouTube

Robot desinfectante de Singapur probado en lucha contra virus

Electrónica