fbpx

Proteger los datos personales va más alla de su cifrado

A pesar del cifrado, las filtraciones de datos personales se están convirtiendo en un problema para varias organizaciones.

Candado y un patrón.

Una nueva metodología altera permanentemente los conjuntos de datos de encuestas para proteger la privacidad de los consumidores, cuando los datos se comparten, al tiempo que conserva un nivel de precisión razonable para estos conjuntos de datos. / Foto: Pixabay

EurekAlert | Drexel University

Escucha este artículo


Read in english: Beyond encryption: Protecting consumer privacy while keeping survey results accurate

No sorprende que los datos de los consumidores sean recopilados continuamente por varias organizaciones, incluidos los gobiernos locales, las agencias de marketing y las empresas de redes sociales. Estas organizaciones aseguran el anonimato y la confidencialidad al recopilar estos datos, sin embargo, las leyes de privacidad de datos existentes no garantizan que no se produzcan violaciones de datos. Según un informe reciente , más de 2,000 violaciones de datos confirmadas ocurrieron solo en 2019, con el 34% causadas por actores internos como los empleados. Para agregar a eso, las agencias municipales y estatales recopilan datos confidenciales que están obligados por ley a compartir con el público, por cortesía de los movimientos de Datos Abiertos y la Ley de Libertad de Información .

Las leyes de privacidad de datos requieren cifrado y, en algunos casos, la transformación de los datos originales en "datos protegidos" antes de que se divulguen a terceros. Pero para investigadores como Matthew Schneider , PhD, profesor asistente de Ciencias de la Decisión y Sistemas de Información de Gestión en la Facultad de Negocios LeBow de la Universidad de Drexel , esto no es adecuado.

"El cifrado definitivamente ayuda, pero no evita una violación de datos", dijo. "Es similar a salvaguardar su contraseña de correo electrónico. Un actor interno con acceso a la clave de cifrado podría causar fácilmente una violación de datos. Es más conservador desde una perspectiva de riesgo asumir que todos los datos eventualmente saldrán y deberían transformarse antes de compartirlos en cualquier lugar dentro la organización."

En un artículo reciente publicado en el Journal of Marketing Analytics , Schneider y Dawn Iacobucci , PhD, de la Universidad de Vanderbilt, propusieron una nueva metodología que altera permanentemente los conjuntos de datos de encuestas para proteger la privacidad de los consumidores, cuando los datos se comparten, mientras se conserva un nivel de precisión razonable para estos conjuntos de datos.

Lea también: Fortuna latina: 7 latinoamericanos multimillonarios en la lista Forbes

Según los autores, los datos de la encuesta a menudo se mantienen dentro de las organizaciones y se utilizan para fines más allá de la razón original para recopilar los datos . "Las bases de datos y la información del cliente se han convertido en un activo contemporáneo que hace que un negocio sea atractivo para otro al forjar alianzas", dijo Schneider. "Incluso las empresas con altos estándares de seguridad de datos pueden encontrar un desafío para proteger la privacidad de los datos del consumidor".

Otra amenaza menos común, pero demasiado real, según los autores, son los casos en que los empleados han llevado ilegalmente datos de sus antiguas compañías a un puesto con un nuevo empleador , por razones que van desde obtener una impresión favorable con la nueva empresa, perjudicar a la empresa anterior, incluso tener que proporcionar los datos como condición de la oferta de trabajo.

Para Schneider, la solución para cumplir las promesas de privacidad de datos es tecnológica.

"Los datos de la encuesta se utilizan cada vez más para el análisis a nivel de encuestados, como el enlace a otros conjuntos de datos patentados, y las promesas de privacidad pueden no estar garantizadas en la miríada de usos posteriores de los datos", dijo Schneider. "La confidencialidad no garantiza el anonimato. Se necesitan alrededor de tres o cuatro preguntas cuidadosamente formuladas en una encuesta para identificar de manera única a cualquiera".

En el documento, los autores analizaron un conjunto de datos de encuestas que fue recolectado en 2015 por la ciudad de Austin, Texas, y publicado luego de un movimiento de Datos Abiertos. Otras ciudades tienen movimientos similares, como Nueva York y Filadelfia .

"Hay muchos riesgos de privacidad en Open Data, ya que no tienen privacidad, como el gobierno federal que tiene el gran presupuesto y los recursos para contratar a estadísticos, economistas o informáticos para abordar este problema tecnológico", dijo Schneider. "La protección a menudo depende de cómo se usen los datos".

Lea también: Cómo los clientes compran por placer y no por utilidad

La ciudad de Austin administró una encuesta a 2.614 estadounidenses de origen asiático que viven en la ciudad para explorar las necesidades de salud y servicios de una de las poblaciones de más rápido crecimiento de la ciudad con el objetivo de crear niveles más altos de participación comunitaria, políticas e identificar recursos para abordar las necesidades de La comunidad asiática americana. Los funcionarios en Austin publicaron sus conjuntos de datos, según sea necesario, para que estén disponibles para los usuarios.

En un conjunto de datos de encuesta, a cada encuestado se le preguntó su origen étnico, que tenía 32 categorías; edad, que tenía 77 categorías; código postal, que tenía 61 categorías; y género.

"Casi todos son identificables con estas cuatro variables, algunas más que otras", dijo Schneider. "Una vez que los identificó, esta encuesta reveló otras respuestas sensibles como el estado laboral, la afiliación religiosa, los ingresos del hogar, la asequibilidad de la vivienda y muchas preguntas de actitud".

Del mismo modo, la ciudad de Nueva York experimentó un problema de datos abiertos con la Comisión de taxis y limusinas de la ciudad de Nueva York, donde se podían rastrear 124 millones de rutas de conducción hasta la dirección de la casa del conductor.

Un desafío importante al considerar metodologías para alterar los datos de los participantes de manera efectiva es hacerlo de una manera que no cambie en gran medida la precisión de los resultados de la encuesta. La metodología propuesta por los autores se basó en una técnica que se encuentra en las aplicaciones de secuenciación genómica que fue capaz de disfrazar la identidad de los consumidores al tiempo que mantenía la precisión de los conocimientos dentro del 5%.

"Nuestro método esencialmente 'barajaría' los datos demográficos en un conjunto de datos de encuestas", dijo Schneider. "Pero, a diferencia de los métodos anteriores, el nuestro solo baraja los datos cuando mantiene las correlaciones entre las variables importantes que son esenciales para los analistas. Los datos protegidos se simulan a nivel del consumidor pero aún son valiosos para el usuario final. Si este conjunto de datos salió, entonces solo se conocerían las ideas de la organización ".

El documento, "Protección de datos de encuestas a nivel del consumidor", se publicó en el Journal of Marketing Analytics y está disponible en este enlace . Los detalles sobre la nueva metodología se incluyen en el documento.

 

We use cookies to improve our website. By continuing to use this website, you are giving consent to cookies being used. More details…