Classificação de dados

O que é classificação de dados? Diretrizes e Processo

Para proteger seus dados confidenciais, você precisa saber o que é e onde reside. 

Classificação de dados definida 

A classificação de dados é o processo de analisar dados estruturados ou não estruturados e organizá-los em categorias com base no tipo e no conteúdo do arquivo.

A classificação de dados é um processo de busca de arquivos por dados específicos, como se você quisesse encontrar todas as referências a “Szechuan Sauce” na sua rede. Ou se você precisasse saber onde todos os dados protegidos por HIPAA residem em sua rede. Ou se você quiser se preparar para regulamentos de privacidade de dados e precisar identificar qualquer informação pessoalmente identificável (PII) em seus armazenamentos de dados.

 

Classificação de dados 1

 

A classificação de dados é geralmente baseada em um analisador de arquivos combinado com um sistema de análise de string. Um analisador de arquivos permite que o mecanismo de classificação de dados leia o conteúdo de vários tipos diferentes de arquivos. Um sistema de análise de string, em seguida, corresponde os dados nos arquivos aos parâmetros de pesquisa definidos.

RegEx – short for regular expression – é um dos sistemas de análise de string mais comuns que define detalhes sobre padrões de pesquisa. Por exemplo, se eu quisesse encontrar todos os números de cartão de crédito VISA nos meus dados, o RegEx ficaria assim:

\b(?<![:$._’-])(4\d{3}[ -]\d{4}[ -]\d{4}[ -]\d{4}\b|4\d{12}(?:\d{3})?)\b

Essa sequência diz ao sistema RegEx que estamos procurando um padrão com um número de 4 dígitos, começando com o número 4, seguido por um traço e um segundo número de 4 dígitos e… você começa a idéia. Apenas uma cadeia de caracteres que corresponde ao RegEx gera diretamente um resultado positivo.

Embora existam alguns paralelos entre os dois, a classificação de dados não é igual à indexação de dados. A classificação procura identificadores baseados em padrões e retorna uma lista de arquivos e quantas correspondências foram encontradas para cada padrão. Não indexa necessariamente esses arquivos. A indexação ativa a pesquisa, e você precisará pesquisar essas correspondências para atender às solicitações de acesso do assunto dos dados e às solicitações do direito de esquecer.

Razões para a Classificação de Dados

 

Classificação de dados 2

 

O Center for Internet Security (CIS) – que dedica uma seção inteira às proteções de classificação de dados – diz que a classificação de dados é importante porque “em várias violações de alto perfil nos últimos dois anos, os invasores conseguiram acessar dados confidenciais armazenados no mesmos servidores com o mesmo nível de acesso que os dados menos importantes ”.

Além das preocupações com segurança de dados, há várias outras razões para implementar um processo de classificação de dados:

  • Identifique arquivos confidenciais, propriedade intelectual e segredos comerciais
  • Proteger (e bloquear) dados críticos
  • Rastreie os dados regulamentados para conformidade com regulamentações como HIPAA, PCI ou GDPR
  • Otimize os recursos de pesquisa com indexação de dados
  • Descubra padrões ou tendências estatisticamente significativas nos dados
  • Otimize o armazenamento identificando dados duplicados ou obsoletos

Processo de Classificação de Dados: 4 Passos

 

Classificação de dados 3

 

Os processos de classificação de dados diferem ligeiramente dependendo dos objetivos do projeto. Qualquer projeto de classificação de dados requer automação para processar a incrível quantidade de dados que as empresas criam todos os dias. Em geral, existem alguns critérios onipresentes necessários para criar qualquer processo de classificação de dados:

  • Definir os objetivos do processo de classificação de dados. O que você está procurando? Por quê?
  • Crie fluxos de trabalho com base nas ferramentas de classificação selecionadas. Como funciona o processo de classificação? Existe um processo para digitalizar novos dados? Existe um processo para criar novos critérios de classificação?
  • Definir as categorias e critérios de classificação. Que tipos de dados você deve pesquisar? Qual processo você seguirá para validar os resultados da classificação?
  • Definir resultados e uso de dados classificados. Como os resultados são organizados – e como você planeja tomar decisões de negócios com base nesses resultados?

Dicas de Classificação de Dados

  • Use ferramentas automatizadas para processar grandes volumes de dados rapidamente
  • Aproveite o RegExes e o Luhn: crie padrões de classificação personalizados ou implemente software que faça o trabalho pesado para você
  • Valide seus resultados de classificação: ninguém gosta de um falso positivo.
  • Descubra como usar melhor seus resultados e aplicar classificações a tudo, desde segurança de dados até business intelligence.

Perguntas frequentes sobre classificação de dados

Como o Varonis faz a Classificação de Dados de maneira diferente? 

A Varonis tem mais de 400 RegExes pré-configurados para descobrir todas as maneiras de dados PII, PHI e GDPR com um mecanismo de classificação totalmente personalizável que você pode configurar para quaisquer fins comerciais. O Varonis monitora mais de 60 tipos de arquivos prontos (incluindo documentos, planilhas e mais) e identifica novos dados que precisam ser verificados novamente (sem iniciar tudo) para capturar arquivos sensíveis novos e adicionados recentemente, incluindo:

  • Informações pessoais:números de cartão de crédito, números de passaporte, números de carteira de habilitação, números de previdência social, IBAN e muito mais
  • Recordes financeiros
  • Tipos de arquivos de segurança(.cer, crt, p7b, etc.)
  • Dados regulados(GDPR, HIPAA, PII, PHI, PCI, Sarbanes Oxley, GLBA, etc.)

O Varonis Data Classification Engine pode processar aproximadamente 100 GB de dados em uma hora (avisos sobre seu próprio hardware e capacidade de rede) e inclui verificações de falso positivo rigorosas que reduzem a carga de trabalho para analisar os resultados da classificação. Nem toda cadeia numérica de 16 caracteres é um número de cartão de crédito, por exemplo, e Varonis sabe a diferença.

O que vem depois da classificação de dados?

Varonis traz contexto para essa classificação. A Varonis não apenas identifica os dados que você está procurando, mas mostra quem pode acessar esses dados e quem está acessando esses dados. Depois de identificar e classificar os dados confidenciais, você pode realizar ações: aplicar rótulos, bloquear permissões, monitorar o acesso, alertar sobre atividades suspeitas e atender aos requisitos de conformidade, como o direito de ser esquecido. O Varonis Data Classification Engine permite que você proteja seus dados mais sensíveis e importantes contra acesso indesejado, vazamentos acidentais de dados e ataques de segurança.

 

Veja o Varonis Data Classification Engine em ação. AGENDE SUA DEMO.

Escrito por 

Fonte blog.varonis.com