Nesse video explico um pouco de como utilizar a blade de Content Awareness. Esta blade esta presente desde o licenciamento NGFW e permite com que o conteúdo trafegado seja controlado através da extensão de arquivos, tipos de dados, padrões e palavras-chave pré-estabelecidas dentro dos arquivos. Todos os detalhes do Content Awareness podem ser validados no sk119715.
Uma das formas de customizar a identificação de conteúdos é através de padrões via RegEx (Regular Expressions), podendo definir um padrão de dados que pode ser identificado dentro de arquivos de texto por exemplo.
No vídeo é exemplificado com o padrão de CPF, mas existem outros tipos de dados comuns que podem ser identificados. Seguem abaixo alguns deles com suas respectivas expressões:
CPF
\d{3}\.\d{3}\.\d{3}\-\d{2}
123.456.789-00
CNPJ
\d{2}\.\d{3}\.\d{3}\/\d{4}\-\d{2}
12.345.6780001-00
CEP
[0-9]{5}-[0-9]{3}
12345-000
RG
\d{1,2}.?\d{3}.?\d{3}-?(\d{1}|X|x)
12.345.678-00
Ressalto que os padrões acima foram criados e customizados para o laboratório em questão, ou seja, para qualquer uso em ambiente produtivo é necessário realizar validações dos padrões desejados e todos os possíveis casos de uso para cobrir os cenários de extravio de dados da forma mais adequada.