Um detetor de infoType personalizado de expressão regular (regex) permite-lhe criar os seus
próprios detetores que permitem à proteção de dados confidenciais detetar correspondências com base
num padrão de regex. Por exemplo, suponha que tinha números de registos médicos no formato ###-#-#####
. Pode definir um padrão de regex, como o seguinte:
[0-9]{3}-[0-9]{1}-[0-9]{5}
A proteção de dados confidenciais faria então a correspondência com itens como os seguintes:
012-4-56789
Anatomia de um detetor de infoType personalizado de regex
Conforme resumido na
vista geral da API, para criar um detetor de infoType de expressão regular personalizado, define um objeto CustomInfoType
que contém o seguinte:
- O nome que quer dar ao detetor de infoType personalizado, num objeto
InfoType
. - Um valor
Likelihood
opcional. Se omitir este campo, as correspondências de regex devolvem uma probabilidade predefinida deVERY_LIKELY
. Se notar que um detetor de infoType personalizado de regex devolve demasiados falsos positivos, experimente reduzir a probabilidade base e usar regras de deteção para aumentar a probabilidade com informações contextuais. Para saber mais, consulte o artigo Personalizar a probabilidade de localização. - Opcional
DetectionRule
s, ou regras de palavra de ativação. Estas regras ajustam a probabilidade de deteções numa determinada proximidade de palavras de ativação especificadas. Saiba mais acerca das regras de palavra de ativação em Personalizar a probabilidade de deteção. Um valor
SensitivityScore
opcional. Se omitir este campo, as correspondências com a expressão regular devolvem um nível de sensibilidade predefinido deHIGH
.As classificações de sensibilidade são usadas em perfis de dados. Quando cria perfis dos seus dados, a proteção de dados confidenciais usa as pontuações de sensibilidade dos infoTypes para calcular o nível de sensibilidade.
Um objeto
Regex
composto por um único padrão que define a expressão regular.
Como um objeto JSON, um detetor de infoType personalizado de regex que inclui todos os componentes opcionais tem o seguinte aspeto:
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
Exemplo de regex: corresponder a números de registos médicos
O fragmento de JSON e o código nos vários idiomas abaixo mostram
um detetor infoType personalizado de expressão regular que indica
à proteção de dados confidenciais que encontre um número de registo médico
(MRN) no texto de entrada "MRN do paciente 444-5-22222" e atribua a cada correspondência uma
probabilidade de POSSIBLE
.
C#
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Go
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Java
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
PHP
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca cliente para a Proteção de dados confidenciais, consulte o artigo Bibliotecas cliente da Proteção de dados confidenciais.
Para se autenticar na Proteção de dados confidenciais, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
REST
Consulte o início rápido de JSON para mais informações sobre a utilização da API DLP com JSON.
Entrada JSON:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
Saída JSON:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
O resultado mostra que, usando o detetor infoType personalizado ao qual atribuímos o nome C_MRN
e a respetiva regex personalizada, a Proteção de dados confidenciais identificou corretamente o número do registo médico e atribuiu-lhe uma certeza de POSSIBLE
, conforme especificado.
Personalizar a probabilidade de correspondência baseia-se neste exemplo para incluir palavras de contexto.