L'analisi del rischio di reidentificazione, o semplicemente analisi del rischio, è il processo di analisi dei dati sensibili per individuare le proprietà che potrebbero aumentare il rischio di identificazione dei soggetti. Puoi utilizzare i metodi di analisi del rischio prima dell'anonimizzazione per determinare una strategia di anonimizzazione efficace o dopo l'anonimizzazione per monitorare eventuali modifiche o outlier.
Sensitive Data Protection può calcolare quattro metriche del rischio di reidentificazione: k-anonymity, l-diversity, k-map e δ-presence. Se non hai familiarità con l'analisi del rischio o con queste metriche, consulta l'argomento concettuale sull'analisi del rischio prima di continuare.
Questa sezione fornisce una panoramica su come utilizzare Sensitive Data Protection per l'analisi del rischio dei dati strutturati utilizzando una di queste metriche, oltre ad altri argomenti correlati.
Calcolare il rischio di reidentificazione
Sensitive Data Protection può analizzare i dati strutturati archiviati nelle tabelle BigQuery e calcolare le seguenti metriche del rischio di reidentificazione. Fai clic sul link della metrica che vuoi calcolare per saperne di più.
| Metrica | Descrizione |
|---|---|
| k-anonymity | Una proprietà di un set di dati che indica la reidentificabilità dei suoi record. Un set di dati è k-anonymous se i quasi-identificatori per ogni persona nel set di dati sono identici ad almeno k – 1 altre persone nel set di dati. |
| l-diversity | Un'estensione di k-anonymity che misura anche la diversità dei valori sensibili per ogni colonna in cui si presentano. Un set di dati ha l-diversity se, per ogni insieme di righe con quasi-identificatori identici, esistono almeno l valori distinti per ciascun attributo sensibile. |
| k-map | Calcola il rischio di reidentificabilità confrontando un determinato set di dati anonimizzati di soggetti con un set di dati di reidentificazione o "attacco" più grande. |
| δ-presence | Stima la probabilità che un determinato utente in una popolazione più ampia sia presente nel set di dati. Viene utilizzato quando l'appartenenza al set di dati è di per sé informazioni sensibili. |
Calcolare altre statistiche
Sensitive Data Protection può anche calcolare le statistiche numeriche e di classificazione
per i dati archiviati nelle tabelle BigQuery utilizzando la stessa
DlpJob risorsa delle
API di analisi del rischio.
| Metrica | Descrizione |
|---|---|
| Statistiche numeriche | Determina i valori minimo, massimo e quantile per una singola colonna BigQuery. |
| Statistiche numeriche di classificazione | Calcola le statistiche numeriche di classificazione per i singoli bucket dell'istogramma all'interno di una colonna BigQuery. |
Per ulteriori informazioni, vedi Calcolare le statistiche numeriche e di classificazione.
Visualizzare il rischio di reidentificazione
Puoi visualizzare le metriche del rischio calcolate da Sensitive Data Protection direttamente nella Google Cloud console utilizzando Sensitive Data Protection (k-anonymity o l-diversity) o altri Google Cloud prodotti.
| Prodotto | Descrizione |
|---|---|
| Data Studio | Dopo aver calcolato i valori di k-anonymity per un set di dati utilizzando Sensitive Data Protection, puoi visualizzare i risultati in Data Studio. In questo modo, potrai anche comprendere meglio il rischio di reidentificazione e valutare i compromessi in termini di utilità che potresti fare se oscuri o anonimizzi i dati. |