Sensitive Data Protection utilizza tipi di informazioni, o infoType, per definire cosa analizzare. Un infoType è un tipo di dato sensibile, ad esempio nome, indirizzo email, numero di telefono, numero di identificazione, numero di carta di credito e così via.
Ogni infoType definito in Sensitive Data Protection ha un detector corrispondente. Sensitive Data Protection utilizza i rilevatori di infoType nella configurazione delle scansioni per determinare cosa ispezionare e come trasformare i risultati. I nomi dei tipi di informazioni vengono utilizzati anche per visualizzare o segnalare i risultati della scansione.
Questo argomento descrive in dettaglio gli infoType e i rilevatori di infoType e fornisce indicazioni su come utilizzare i rilevatori di infoType durante la scansione dei contenuti per individuare i dati sensibili utilizzando Sensitive Data Protection.
Specificare i rilevatori di infoType
Quando configuri Sensitive Data Protection per analizzare i tuoi contenuti, includi i rilevatori di infoType da utilizzare nella configurazione dell'analisi.
Ad esempio, il seguente codice JSON mostra una semplice richiesta di scansione all'API DLP. Tieni presente che il rilevatore PHONE_NUMBER è specificato in
inspectConfig,
che indica a Sensitive Data Protection di scansionare la stringa specificata per un
numero di telefono.
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"My phone number is (415) 555-0890"
},
"inspectConfig":{
"includeQuote":true,
"minLikelihood":"POSSIBLE",
"infoTypes":{
"name":"PHONE_NUMBER"
}
}
}
La richiesta precedente restituisce quanto segue:
{
"result":{
"findings":[
{
"quote":"(415) 555-0890",
"infoType":{
"name":"PHONE_NUMBER"
},
"likelihood":"VERY_LIKELY",
"location":{
"byteRange":{
"start":"19",
"end":"33"
},
"codepointRange":{
"start":"19",
"end":"33"
}
},
"createTime":"2018-10-29T23:46:34.535Z"
}
]
}
}
Specifica sempre gli infoTypes nella configurazione della scansione. Se non specifichi alcun infoType, Sensitive Data Protection utilizza un elenco di infoType predefiniti. A seconda della quantità di contenuti da analizzare, la scansione per gli infoType predefiniti può richiedere troppo tempo o essere troppo costosa.
Per saperne di più su come utilizzare i rilevatori di infoType per analizzare i tuoi contenuti, consulta uno degli argomenti su come fare relativi a ispezione, oscuramento o anonimizzazione.
Tipi di rilevatori di infoType
I rilevatori di tipi di informazioni (o "infoType") sono i meccanismi che Sensitive Data Protection utilizza per trovare i dati sensibili.
Sensitive Data Protection include diversi tipi di rilevatori di infoType, tutti riassunti qui:
- I rilevatori di infoType integrati sono integrati in Sensitive Data Protection. Sono inclusi rilevatori per tipi di dati sensibili specifici per paese o regione, nonché tipi di dati applicabili a livello globale.
- I rivelatori di infoType personalizzati sono rilevatori che crei
personalmente. Esistono tre tipi di rilevatori di infoType personalizzati:
- I rilevatori di dizionari personalizzati regolari sono semplici elenchi di parole che la protezione dei dati sensibili abbina. Utilizza i rilevatori di dizionari personalizzati regolari quando hai un elenco di fino a diverse decine di migliaia di parole o frasi. I rilevatori personalizzati di dizionari regolari sono preferibili se non prevedi che il tuo elenco di parole cambi in modo significativo.
- I detector di dizionari personalizzati archiviati vengono generati da Sensitive Data Protection utilizzando grandi elenchi di parole o frasi archiviati in Cloud Storage o BigQuery. Utilizza i rilevatori di dizionari personalizzati archiviati quando hai un elenco di parole o frasi di grandi dimensioni, fino a decine di milioni.
- I rilevatori di espressioni regolari (regex) consentono a Sensitive Data Protection di rilevare le corrispondenze in base a un pattern di espressione regolare.
Per perfezionare i risultati della scansione, puoi creare regole di ispezione.
Rilevatori di infoType integrati
I rilevatori di infoType integrati sono integrati in Sensitive Data Protection e
includono rilevatori per tipi di dati sensibili specifici per paese o regione, come
il Numéro d'Inscription au Répertoire (NIR) francese (FRANCE_NIR), il numero di patente di guida
del Regno Unito (UK_DRIVERS_LICENSE_NUMBER) e il numero di previdenza sociale
degli Stati Uniti (US_SOCIAL_SECURITY_NUMBER). Includono anche tipi di dati applicabili a livello globale, come
il nome di una persona (PERSON_NAME), numeri di telefono (PHONE_NUMBER),
indirizzi email (EMAIL_ADDRESS) e numeri di carte di credito
(CREDIT_CARD_NUMBER).Per rilevare i contenuti corrispondenti agli infoType,
Sensitive Data Protection utilizza varie tecniche, tra cui la corrispondenza
dei pattern, i checksum, il machine learning, l'analisi del contesto e altre ancora.
L'elenco dei rilevatori di infoType integrati viene aggiornato continuamente. Per un elenco completo dei rilevatori di infoType integrati attualmente supportati, consulta Guida di riferimento per i rilevatori di infoType.
Puoi anche visualizzare un elenco completo di tutti i rilevatori di infoType integrati chiamando il metodo
infoTypes.list
di Sensitive Data Protection.
Rilevatori di infoType personalizzati
Esistono tre tipi di rilevatori di infoType personalizzati:
- Rilevatori di dizionari personalizzati regolari
- Rilevatori di dizionari personalizzati archiviati
- Espressioni regolari (regex)
Per perfezionare i risultati della scansione, puoi creare regole di ispezione.
Rilevatori di dizionari personalizzati regolari
Utilizza rilevatori di dizionari personalizzati regolari per trovare corrispondenze con un breve elenco (fino a diverse decine di migliaia) di parole o frasi. Un dizionario personalizzato normale può fungere da rilevatore univoco.
I rilevatori di dizionari personalizzati sono utili quando vuoi eseguire la scansione di un elenco di parole o frasi che non corrispondono facilmente a un'espressione regolare o a un rilevatore integrato. Ad esempio, supponiamo che tu voglia cercare sale conferenze a cui si fa comunemente riferimento con i nomi assegnati anziché con i numeri, come nomi di stati o regioni, punti di riferimento, personaggi di fantasia e così via. Puoi creare un rilevatore di dizionari personalizzato normale che contenga un elenco di questi nomi delle stanze. Sensitive Data Protection può eseguire la scansione dei tuoi contenuti per ciascuno dei nomi delle stanze e restituire una corrispondenza quando ne rileva uno nel contesto. Scopri di più su come Sensitive Data Protection abbina parole e frasi del dizionario nella sezione "Specifiche della corrispondenza del dizionario" della pagina Creazione di un rilevatore di dizionario personalizzato regolare.
Per ulteriori dettagli sul funzionamento dei rilevatori di infoType personalizzati del dizionario normale, nonché esempi pratici, consulta Creazione di un rilevatore di dizionari personalizzato normale.
Rilevatori di dizionari personalizzati archiviati
Utilizza i rilevatori di dizionari personalizzati archiviati quando hai più di qualche parola o frase da scansionare o se il tuo elenco di parole o frasi cambia spesso. I rilevatori di dizionari personalizzati archiviati possono corrispondere a decine di milioni di parole o frasi.
I rilevatori di dizionari personalizzati archiviati, per loro natura di rilevatori personalizzati molto grandi, vengono creati in modo diverso rispetto ai rilevatori personalizzati di espressioni regolari e ai rilevatori di dizionari personalizzati normali. Ogni dizionario personalizzato memorizzato ha due componenti:
- Un elenco di frasi che crei e definisci. L'elenco viene archiviato come un file di testo in Cloud Storage o una colonna in una tabella BigQuery.
- I file dizionario generati, creati da Sensitive Data Protection in base all'elenco di frasi. I file del dizionario sono archiviati in Cloud Storage e sono costituiti da una copia dei dati delle frasi di origine più i filtri Bloom, che aiutano nella ricerca e nella corrispondenza. Non puoi modificare direttamente questi file.
Dopo aver creato un elenco di parole e utilizzato Sensitive Data Protection per generare un dizionario personalizzato, avvii o pianifichi una scansione utilizzando un rilevatore di dizionari personalizzati archiviato in modo simile ad altri rilevatori di infoType.
Per maggiori dettagli su come funzionano i rilevatori di dizionari personalizzati archiviati, nonché esempi pratici, vedi Creazione di un rilevatore di dizionari personalizzati archiviati.
Espressioni regolari
Un rilevatore di infoType personalizzato con espressione regolare (regex) ti consente di creare
i tuoi rilevatori di infoType che consentono a Sensitive Data Protection di rilevare
corrispondenze in base a un pattern regex. Ad esempio, supponiamo che tu abbia numeri di cartelle cliniche nel formato ###-#-#####. Potresti definire un pattern regex come il seguente:
[1-9]{3}-[1-9]{1}-[1-9]{5}
Sensitive Data Protection troverebbe corrispondenze con elementi come questo:
123-4-56789
Puoi anche specificare una probabilità da assegnare a ogni corrispondenza
dell'infoType personalizzato. ovvero, quando Sensitive Data Protection trova una corrispondenza con la sequenza specificata, assegna la probabilità che hai indicato.
Ciò è utile perché se la tua espressione regolare personalizzata definisce una sequenza sufficientemente comune da poter corrispondere facilmente a un'altra sequenza casuale, non vorresti che la protezione dei dati sensibili etichettasse ogni corrispondenza come VERY_LIKELY. In questo modo
si minerebbe la fiducia nei risultati della scansione e si potrebbe causare la deidentificazione di informazioni errate.
Per saperne di più sui rilevatori di infoType personalizzati con espressioni regolari e per vederli in azione, consulta Creazione di un rilevatore di espressioni regolari personalizzato.