Sensitive Data Protection contiene molti detector infoType integrati, ma puoi anche crearne di personalizzati. Puoi personalizzare il comportamento di rilevamento definendo rilevatori di infoType personalizzati, in modo che Sensitive Data Protection ispezioni o anonimizzi i dati sensibili che corrispondono ai pattern specificati. Di seguito sono riportati i tipi di rivelatori di infoType personalizzati:
- I rilevatori di dizionari personalizzati regolari sono semplici elenchi di parole e frasi che la protezione dei dati sensibili abbina. Utilizza i rilevatori di dizionari personalizzati regolari quando hai al massimo diverse centinaia di migliaia di parole.
- I rilevatori di dizionari personalizzati di grandi dimensioni vengono generati da Sensitive Data Protection utilizzando grandi elenchi di parole o frasi archiviati in Cloud Storage o BigQuery. Utilizza i rilevatori di dizionari personalizzati di grandi dimensioni quando hai un elenco di parole o frasi di grandi dimensioni, fino a decine di milioni.
- I rilevatori di espressioni regolari (regex) consentono a Sensitive Data Protection di rilevare le corrispondenze in base a un pattern di espressione regolare.
- I rilevatori di infoType surrogati rilevano l'output della trasformazione di deidentificazione di Sensitive Data Protection
CryptoReplaceFfxFpeConfig. Questo rilevatore di infoType personalizzato viene utilizzato solo con il metodocontent:reidentifyper invertire l'anonimizzazione utilizzando la crittografia con protezione del formato (FPE) in modalità FFX. Per questo motivo, i surrogati non sono descritti in dettaglio in questi argomenti. Per ulteriori informazioni su come e quando utilizzare i rilevatori di infoType personalizzati surrogati, consulta Pseudonimizzazione.
Inoltre, Sensitive Data Protection include il concetto di regole di ispezione, che ti consentono di perfezionare i risultati della scansione utilizzando quanto segue:
- Le regole di esclusione ti consentono di escludere risultati falsi o indesiderati aggiungendo regole a un rilevatore infoType integrato o personalizzato.
- Le regole per hotword ti consentono di aumentare la quantità o l'accuratezza dei risultati restituiti aggiungendo regole a un rilevatore infoType integrato o personalizzato.
Per scoprire di più sui rilevatori di infoType personalizzati, consulta la pagina dei concetti InfoType e rilevatori di infoType. Per diversi esempi che puoi utilizzare o modificare come preferisci, consulta Esempi di rilevatori di infoType personalizzati. Il resto di questo argomento descrive come utilizzare Sensitive Data Protection per creare rilevatori di infoType personalizzati.
Dove utilizzare i rilevatori di infoType personalizzati
I rilevatori di infoType personalizzati sono definiti nell'oggetto
CustomInfoType. Quando configuri quanto segue, devi specificare un CustomInfoType nell'oggetto
InspectConfig:
- Ispezione tramite
projects.content.inspect. - Job di ispezione all'interno di
InspectJobConfig. - Modelli di ispezione all'interno di
InspectTemplate. - Anonimizzazione mediante
projects.content.deidentify. - Modelli di anonimizzazione all'interno di
DeidentifyTemplate. - Reidentificazione dei contenuti anonimizzati con FPE in modalità FFX utilizzando
projects.content.reidentify. Questo scenario è specifico per i rilevatori di infoType personalizzati surrogati.
Panoramica dell'API
L'oggetto
CustomInfoType
ti consente di creare un rilevatore di infoType personalizzato per nuovi contenuti o di
ottimizzare i risultati restituiti dai rilevatori di infoType predefiniti.
L'oggetto CustomInfoType è composto dai seguenti campi, impostati
come descritto:
"infotype": il nome del rilevatore di InfoType personalizzato, contenuto in un oggettoInfoType."likelihood": il valoreLikelihoodpredefinito da restituire per questo rilevatore di InfoType personalizzato. Puoi specificare valoriLikelihoodalternativi in"detectionRules"che sostituiranno questo valoreLikelihooddi base se il risultato soddisfa i criteri specificati dalla regola. Se non includi il campo"likelihood", il rilevatore di infoType personalizzato utilizza per impostazione predefinitaVERY_LIKELY. Per saperne di più sulla probabilità, consulta la pagina dei concetti relativi alla probabilità."detectionRules": un insieme di oggettiDetectionRuleda applicare anche a tutti i risultati di questo rilevatore di infoType personalizzato. È qui che specifichi le regole per le hotword, come gli oggettiHotwordRule. Le regole vengono applicate nell'ordine in cui vengono specificate. Questo campo non si applica agli oggettiSurrogateType."sensitivityScore": il valoreSensitivityScoreda restituire per questo rilevatore di InfoType personalizzato. Se non includi il campo"sensitivityScore", il rilevatore di infoType personalizzato viene impostato per impostazione predefinita suVERY_LIKELY.I punteggi di sensibilità vengono utilizzati nei profili dei dati. Durante la profilazione dei dati, Sensitive Data Protection utilizza i punteggi di sensibilità degli infoType per calcolare il livello di sensibilità.
Uno dei seguenti campi, a seconda del tipo di rilevatore di infoType personalizzato che stai creando:
"dictionary": un oggettoDictionaryche contiene un elenco di parole o frasi da cercare."regex": un oggettoRegexche contiene un singolo pattern che definisce l'espressione regolare."surrogateType": un oggettoSurrogateType, se presente, indica che il rilevatore di InfoType personalizzato è un surrogato. Per ulteriori informazioni su come utilizzare i rilevatori di infoType personalizzati surrogati, consulta la sezione Pseudonimizzazione."storedType": un riferimento a un oggettoStoredInfoTypeesistente. Questo campo è obbligatorio quando crei un rilevatore di dizionari personalizzato di grandi dimensioni. Anche se puoi creare rilevatori di dizionari regolari o espressioni regolari definendo questo campo, è più semplice crearli definendo rispettivamente il campodictionaryoregex.
Passaggi successivi
Scopri di più sulla creazione di infoType personalizzati nei seguenti argomenti:
- Creazione di un rilevatore di dizionari personalizzato normale: scopri come creare un rilevatore di infoType personalizzato per trovare corrispondenze in un elenco di parole e frasi.
- Creazione di un rilevatore di dizionari personalizzato di grandi dimensioni: Scopri come trovare corrispondenze in un elenco molto lungo di parole e frasi. I rivelatori di infoType personalizzati archiviati possono corrispondere a decine di milioni di parole.
- Creazione di un rilevatore regex personalizzato: scopri come creare un rilevatore di infoType personalizzato per trovare corrispondenze in base a un'espressione regolare.
- Modifica dei rilevatori infoType per perfezionare i risultati della scansione: scopri come creare modificatori per i rilevatori infoType integrati e personalizzati che possono perfezionare i risultati della scansione.
- Personalizzazione della probabilità di corrispondenza: Scopri come utilizzare le regole di rilevamento e le hotword per personalizzare i valori di probabilità assegnati alle corrispondenze del rilevatore personalizzato.
- Esempi di rilevatori di infoType personalizzati: diverse definizioni di rilevatori di infoType personalizzati JSON di esempio che puoi utilizzare o modificare a tuo piacimento.