BLOG | ESCRITÓRIO DO CTO

Mascaramento de dados e como ele difere da prevenção de vazamento de dados

Miniatura de Lori MacVittie
Lori MacVittie
Publicado em 20 de novembro de 2023

Há muitas tecnologias que surgiram em 2023 e que merecem estar na lista de observação de qualquer tecnólogo. Entre elas está o mascaramento de dados. Apesar da semelhança com a prevenção de vazamento de dados na implementação, o mascaramento de dados e a prevenção de vazamento de dados têm dois casos de uso muito diferentes. 

Este último tem sido um recurso de todos os principais aplicativos da web e soluções de segurança de API há anos. Mas o mascaramento de dados está apenas começando a se tornar necessário, graças ao surgimento de tecnologias como a IA generativa

O que é mascaramento de dados?

O mascaramento de dados é uma técnica usada para proteger informações confidenciais substituindo ou ofuscando os dados originais por dados fictícios ou embaralhados que mantêm uma estrutura e formato semelhantes. Esse método é comumente usado em situações em que os dados devem ser compartilhados ou usados para fins de teste, treinamento ou análise, mas as informações confidenciais devem permanecer confidenciais. O mascaramento de dados ajuda as organizações a cumprir as regulamentações de privacidade de dados, reduzir o risco de violações de dados e proteger a privacidade de indivíduos cujas informações estão contidas nos conjuntos de dados.

O que é prevenção de vazamento de dados?

Prevenção de vazamento de dados (DLP) é um conjunto de estratégias, políticas e ferramentas projetadas para proteger informações confidenciais contra acesso não autorizado, divulgação ou uso indevido. O objetivo principal do DLP é evitar o vazamento acidental ou intencional de dados confidenciais, como informações pessoais, propriedade intelectual ou segredos comerciais, fora da rede ou dos sistemas de uma organização.

Comparação de maçãs com maçãs?

Pode parecer que o mercado está adotando o pedantismo e afirmando que maçãs verdes são diferentes de maçãs vermelhas. Afinal, tanto o mascaramento de dados quanto o DLP tendem a depender das mesmas tecnologias para “mascarar” ou “ofuscar” campos de dados confidenciais usados por aplicativos e APIs. 

A diferença é dupla. 

Primeiro, os principais usuários do mascaramento de dados são desenvolvedores, cientistas de dados e MLOps. Eles são funcionários ou parceiros que precisam testar e treinar ou analisar dados reais de clientes . Isso coloca em risco os clientes que preferem permanecer anônimos e podem ter recebido garantias de que o farão por meio de uma política de privacidade corporativa. Os usuários de DLP são, em última análise, o negócio. É uma responsabilidade corporativa cumprir regulamentações que exigem o mascaramento de informações confidenciais, como números de contas e cartões de crédito, e a empresa sofre quando os dados vazam. Pode-se argumentar que as organizações empregam o DLP para proteger os consumidores — e elas o fazem —, mas o principal motivador geralmente é a regulamentação. 

Em segundo lugar, o DLP identifica e mascara apenas um subconjunto específico de informações pessoais. Quando recebo uma fatura, meu número de conta é mascarado, mas meu nome e endereço não. Com o mascaramento de dados, muitas vezes nomes, endereços e outras informações de identificação são ofuscados para garantir que os clientes permaneçam anônimos. Isso é particularmente verdadeiro quando o caso de uso é a análise de segmentação, onde padrões e relacionamentos estão sendo buscados entre clientes para fins de marketing ou previsão, mas há um motivo para não identificar clientes específicos. 

O mascaramento de dados deve estar na sua lista de observação

Se você está fazendo uma “lista de observação” de tecnologias para 2024, então o mascaramento de dados definitivamente merece um lugar entre as dez primeiras. 

Isso ocorre devido à ampla aplicabilidade a muitos esforços, mas especialmente aqueles que estão se inclinando para a análise e o treinamento de modelos de ML para obter insights sobre o comportamento do cliente ou descobrir padrões que informam a estratégia de negócios. 

À medida que a IA generativa — e tradicional — começou a se infiltrar em todos os produtos e serviços do planeta, os consumidores se tornaram cada vez mais conscientes da necessidade de privacidade. Ser capaz de mascarar dados confidenciais permitirá que uma empresa avance com iniciativas de IA e satisfaça a necessidade de privacidade de seus clientes.