Detetores infoType personalizados

A proteção de dados confidenciais contém muitos detetores infoType integrados, mas também pode criar os seus próprios. Pode personalizar o comportamento de deteção definindo os seus próprios detetores infoType personalizados, para que a proteção de dados confidenciais inspecione ou desidentifique dados confidenciais que correspondam a padrões especificados por si. Seguem-se os tipos de detetores infoType personalizados:

  • Os detetores de dicionários personalizados normais são listas simples de palavras e expressões com as quais a proteção de dados confidenciais estabelece correspondência. Use detetores de dicionários personalizados normais quando tiver, no máximo, várias centenas de milhares de palavras.
  • Os detetores de dicionários personalizados grandes são gerados pela proteção de dados confidenciais através de grandes listas de palavras ou expressões armazenadas no Cloud Storage ou no BigQuery. Use detetores de dicionários personalizados grandes quando tiver uma lista grande de palavras ou expressões, até dezenas de milhões.
  • Os detetores de expressões regulares (regex) permitem que a proteção de dados confidenciais detete correspondências com base num padrão de expressão regular.
  • Os detetores infoType substitutos detetam a saída da transformação de desidentificação da proteção de dados confidenciais CryptoReplaceFfxFpeConfig. Este detetor de infoType personalizado só é usado com o método content:reidentify para reverter a desidentificação através da encriptação que preserva o formato (FPE) no modo FFX. Por este motivo, os substitutos não são descritos detalhadamente nestes tópicos. Para mais informações sobre como e quando usar detetores de infoType personalizados substitutos, consulte o artigo Pseudonimização.

Além disso, a proteção de dados confidenciais inclui o conceito de regras de inspeção, que lhe permitem otimizar os resultados da análise através do seguinte:

  • As regras de exclusão permitem-lhe excluir resultados falsos ou indesejados através da adição de regras a um detetor de infoType incorporado ou personalizado.
  • As regras de palavras-chave permitem-lhe aumentar a quantidade ou a precisão dos resultados devolvidos adicionando regras a um detetor de infoType integrado ou personalizado.

Para saber mais acerca dos detetores infoType personalizados, consulte a página de conceitos InfoTypes e detetores infoType. Para ver vários exemplos que pode usar ou alterar conforme pretender, consulte os exemplos de detetores infoType personalizados. O resto deste tópico descreve como usar a proteção de dados confidenciais para criar os seus próprios detetores infoType personalizados.

Onde usar detetores de infoType personalizados

Os detetores de infoType personalizados são definidos no objeto CustomInfoType. Especifica um CustomInfoType no objeto InspectConfig quando configura o seguinte:

Vista geral da API

O objeto CustomInfoType permite-lhe criar um detetor infoType personalizado para novo conteúdo ou ajustar os resultados devolvidos pelos detetores infoType predefinidos.

O objeto CustomInfoType é composto pelos seguintes campos, que são definidos conforme descrito:

  • "infotype": o nome do detetor infoType personalizado, contido num objeto InfoType.
  • "likelihood": O valor Likelihood predefinido a devolver para este detetor infoType personalizado. Pode especificar valores Likelihood"detectionRules" alternativos que substituem este valor base Likelihood"detectionRules" se a descoberta cumprir os critérios especificados pela regra. Se não incluir o campo "likelihood", o detetor infoType personalizado usa o valor predefinido VERY_LIKELY. Para mais informações sobre a probabilidade, consulte a página do conceito de Probabilidade.
  • "detectionRules": Um conjunto de objetos DetectionRule a aplicar adicionalmente a todas as deteções deste detetor infoType personalizado. É aqui que especifica as regras de palavra de ativação como objetos.HotwordRule As regras são aplicadas pela ordem em que são especificadas. Este campo não se aplica a objetos SurrogateType.
  • "sensitivityScore": O valor de SensitivityScore a devolver para este detetor infoType personalizado. Se não incluir o campo "sensitivityScore", o detetor infoType personalizado é predefinido para VERY_LIKELY.

    As classificações de sensibilidade são usadas em perfis de dados. Quando cria perfis dos seus dados, a proteção de dados confidenciais usa as pontuações de sensibilidade dos infoTypes para calcular o nível de sensibilidade.

  • Um dos seguintes campos, consoante o tipo de detetor infoType personalizado que está a criar:

    • "dictionary": um objeto A Dictionary que contém uma lista de palavras ou expressões a pesquisar.
    • "regex": A Regex objeto, que contém um único padrão que define a expressão regular.
    • "surrogateType": Um SurrogateType objeto, se presente, indica que o detetor infoType personalizado é um substituto. Para mais informações sobre como usar detetores de infoType personalizados substitutos, consulte o artigo Pseudonimização.
    • "storedType": uma referência a um objeto StoredInfoType existente. Este campo é obrigatório quando cria um detetor de dicionário personalizado grande. Embora possa criar detetores de dicionários normais ou detetores de expressões regulares definindo este campo, é mais simples criá-los definindo o campo dictionary ou o campo regex, respetivamente.

Passos seguintes

Saiba como criar infoTypes personalizados nos seguintes tópicos: