BLOG | OFICINA DEL CTO

Enmascaramiento de datos y su diferencia con la prevención de fuga de datos

Miniatura de Lori MacVittie
Lori MacVittie
Publicado el 20 de noviembre de 2023

Hay muchas tecnologías que han surgido en 2023 que merecen estar en la lista de vigilancia de cualquier tecnólogo. Entre ellos se encuentra el enmascaramiento de datos. A pesar de la similitud con la prevención de fuga de datos en la implementación, el enmascaramiento de datos y la prevención de fuga de datos tienen dos casos de uso muy diferentes. 

Esta última ha sido una capacidad de todas las soluciones de seguridad de API y aplicaciones web líderes durante años. Pero el enmascaramiento de datos recién está empezando a hacerse notar, gracias al auge de tecnologías como la IA generativa

¿Qué es el enmascaramiento de datos?

El enmascaramiento de datos es una técnica utilizada para proteger información confidencial reemplazando u ofuscando los datos originales con datos ficticios o codificados que mantienen una estructura y un formato similares. Este método se utiliza comúnmente en situaciones en las que se deben compartir o utilizar datos para fines de prueba, capacitación o análisis, pero la información sensible real debe permanecer confidencial. El enmascaramiento de datos ayuda a las organizaciones a cumplir con las regulaciones de privacidad de datos, reducir el riesgo de violaciones de datos y proteger la privacidad de las personas cuya información está contenida en los conjuntos de datos.

¿Qué es la prevención de fuga de datos?

La prevención de fuga de datos (DLP) es un conjunto de estrategias, políticas y herramientas diseñadas para proteger la información confidencial contra acceso no autorizado, divulgación o uso indebido. El objetivo principal de DLP es evitar la fuga accidental o intencional de datos confidenciales, como información personal, propiedad intelectual o secretos comerciales, fuera de la red o los sistemas de una organización.

¿Comparar peras con peras?

Podría parecer que el mercado está adoptando la pedantería y afirmando que las manzanas verdes son diferentes a las manzanas rojas. Después de todo, tanto el enmascaramiento de datos como DLP tienden a depender de las mismas tecnologías para “enmascarar” u “ofuscar” campos de datos sensibles utilizados por aplicações y API. 

La diferencia es doble. 

En primer lugar, los principales usuarios del enmascaramiento de datos son los desarrolladores, los científicos de datos y los MLOps. Son empleados o socios que necesitan probar y capacitarse con o analizar datos reales de clientes . Esto pone en riesgo a los clientes que prefieren permanecer anónimos y es posible que una política de privacidad corporativa les haya asegurado que así lo harían. Los usuarios de DLP son, en última instancia, el negocio. Es una responsabilidad corporativa cumplir con las regulaciones que exigen enmascarar información confidencial, como números de cuentas y tarjetas de crédito, y la empresa sufre cuando se filtran datos. Se puede argumentar que las organizaciones emplean DLP para proteger a los consumidores (y lo hacen), pero el impulsor principal suele ser la regulación. 

En segundo lugar, DLP identifica y enmascara sólo un subconjunto específico de información personal. Cuando recibo una factura, mi número de cuenta está oculto, pero mi nombre y dirección no. Con el enmascaramiento de datos, a menudo se ocultan nombres, direcciones y otros datos de identificación para garantizar que los clientes permanezcan anónimos. Esto es particularmente cierto cuando el caso de uso está orientado al análisis, donde se buscan patrones y relaciones entre los clientes para fines de marketing o pronóstico pero hay una razón para no identificar clientes específicos. 

El enmascaramiento de datos debería estar en su lista de vigilancia.

Si está haciendo una “lista de vigilancia” de tecnologías para 2024, entonces el enmascaramiento de datos definitivamente merece un lugar entre las diez primeras. 

Esto se debe a su amplia aplicabilidad a muchos esfuerzos, pero especialmente a aquellos que se inclinan hacia el análisis y el entrenamiento de modelos de ML para obtener información sobre el comportamiento del cliente o descubrir patrones que informen la estrategia comercial. 

A medida que la IA generativa (y tradicional) ha comenzado a filtrarse en todos los productos y servicios del planeta, los consumidores se han vuelto cada vez más conscientes de la necesidad de privacidad. Poder enmascarar datos confidenciales permitirá a una empresa impulsar iniciativas de IA y satisfacer la necesidad de privacidad de sus clientes.