A proteção de dados confidenciais contém muitos detetores infoType integrados, mas também pode criar os seus próprios. Pode personalizar o comportamento de deteção definindo os seus próprios detetores infoType personalizados, para que a proteção de dados confidenciais inspecione ou desidentifique dados confidenciais que correspondam a padrões especificados por si. Seguem-se os tipos de detetores infoType personalizados:
- Os detetores de dicionários personalizados normais são listas simples de palavras e expressões com as quais a proteção de dados confidenciais estabelece correspondência. Use detetores de dicionários personalizados normais quando tiver, no máximo, várias centenas de milhares de palavras.
- Os detetores de dicionários personalizados grandes são gerados pela proteção de dados confidenciais através de grandes listas de palavras ou expressões armazenadas no Cloud Storage ou no BigQuery. Use detetores de dicionários personalizados grandes quando tiver uma lista grande de palavras ou expressões, até dezenas de milhões.
- Os detetores de expressões regulares (regex) permitem que a proteção de dados confidenciais detete correspondências com base num padrão de expressão regular.
- Os detetores infoType substitutos detetam a saída da transformação de desidentificação da proteção de dados confidenciais
CryptoReplaceFfxFpeConfig
. Este detetor de infoType personalizado só é usado com o métodocontent:reidentify
para reverter a desidentificação através da encriptação que preserva o formato (FPE) no modo FFX. Por este motivo, os substitutos não são descritos detalhadamente nestes tópicos. Para mais informações sobre como e quando usar detetores de infoType personalizados substitutos, consulte o artigo Pseudonimização.
Além disso, a proteção de dados confidenciais inclui o conceito de regras de inspeção, que lhe permitem otimizar os resultados da análise através do seguinte:
- As regras de exclusão permitem-lhe excluir resultados falsos ou indesejados através da adição de regras a um detetor de infoType incorporado ou personalizado.
- As regras de palavras-chave permitem-lhe aumentar a quantidade ou a precisão dos resultados devolvidos adicionando regras a um detetor de infoType integrado ou personalizado.
Para saber mais acerca dos detetores infoType personalizados, consulte a página de conceitos InfoTypes e detetores infoType. Para ver vários exemplos que pode usar ou alterar conforme pretender, consulte os exemplos de detetores infoType personalizados. O resto deste tópico descreve como usar a proteção de dados confidenciais para criar os seus próprios detetores infoType personalizados.
Onde usar detetores de infoType personalizados
Os detetores de infoType personalizados são definidos no objeto
CustomInfoType
. Especifica um CustomInfoType
no objeto InspectConfig
quando configura o seguinte:
- Inspeção com
projects.content.inspect
. - Trabalhos de inspeção no interior de
InspectJobConfig
. - Modelos de inspeção em
InspectTemplate
. - Desidentificação através de
projects.content.deidentify
. - Modelos de desidentificação no interior de
DeidentifyTemplate
. - Reidentificação de conteúdo que foi desidentificado com FPE no modo FFX usando
projects.content.reidentify
. Este cenário é específico dos detetores de infoTypes personalizados substitutos.
Vista geral da API
O objeto
CustomInfoType
permite-lhe criar um detetor infoType personalizado para novo conteúdo ou
ajustar os resultados devolvidos pelos detetores infoType predefinidos.
O objeto CustomInfoType
é composto pelos seguintes campos, que são definidos
conforme descrito:
"infotype"
: o nome do detetor infoType personalizado, contido num objetoInfoType
."likelihood"
: O valorLikelihood
predefinido a devolver para este detetor infoType personalizado. Pode especificar valoresLikelihood
"detectionRules"
alternativos que substituem este valor baseLikelihood
"detectionRules"
se a descoberta cumprir os critérios especificados pela regra. Se não incluir o campo"likelihood"
, o detetor infoType personalizado usa o valor predefinidoVERY_LIKELY
. Para mais informações sobre a probabilidade, consulte a página do conceito de Probabilidade."detectionRules"
: Um conjunto de objetosDetectionRule
a aplicar adicionalmente a todas as deteções deste detetor infoType personalizado. É aqui que especifica as regras de palavra de ativação como objetos.HotwordRule
As regras são aplicadas pela ordem em que são especificadas. Este campo não se aplica a objetosSurrogateType
."sensitivityScore"
: O valor deSensitivityScore
a devolver para este detetor infoType personalizado. Se não incluir o campo"sensitivityScore"
, o detetor infoType personalizado é predefinido paraVERY_LIKELY
.As classificações de sensibilidade são usadas em perfis de dados. Quando cria perfis dos seus dados, a proteção de dados confidenciais usa as pontuações de sensibilidade dos infoTypes para calcular o nível de sensibilidade.
Um dos seguintes campos, consoante o tipo de detetor infoType personalizado que está a criar:
"dictionary"
: um objeto ADictionary
que contém uma lista de palavras ou expressões a pesquisar."regex"
: ARegex
objeto, que contém um único padrão que define a expressão regular."surrogateType"
: UmSurrogateType
objeto, se presente, indica que o detetor infoType personalizado é um substituto. Para mais informações sobre como usar detetores de infoType personalizados substitutos, consulte o artigo Pseudonimização."storedType"
: uma referência a um objetoStoredInfoType
existente. Este campo é obrigatório quando cria um detetor de dicionário personalizado grande. Embora possa criar detetores de dicionários normais ou detetores de expressões regulares definindo este campo, é mais simples criá-los definindo o campodictionary
ou o camporegex
, respetivamente.
Passos seguintes
Saiba como criar infoTypes personalizados nos seguintes tópicos:
- Criar um detetor de dicionário personalizado normal: Saiba como criar um detetor de infoType personalizado para corresponder a resultados numa lista de palavras e expressões.
- Criar um detetor de dicionário personalizado grande: saiba como fazer corresponder resultados numa lista muito grande de palavras e expressões. Os detetores de infoTypes personalizados armazenados podem fazer a correspondência de até dezenas de milhões de palavras.
- Criar um detetor de regex personalizado: saiba como criar um detetor de infoType personalizado para corresponder a resultados numa expressão regular.
- Modificar detetores infoType para refinar os resultados da análise: saiba como criar modificadores para detetores infoType integrados e personalizados que podem otimizar os resultados da análise.
- Personalizar a probabilidade de correspondência: Saiba como usar regras de deteção e palavras de ativação para personalizar os valores de probabilidade atribuídos a correspondências de detetores personalizados.
- Exemplos de detetores de infoType personalizados: vários exemplos de definições de detetores de infoType personalizados JSON que pode usar ou alterar conforme considerar adequado.