L-diversity è una proprietà di un set di dati ed è un'estensione di k-anonymity che misura la diversità dei valori sensibili per ogni colonna in cui si presentano. Un set di dati ha l-diversity se, per ogni insieme di righe con quasi-identificatori identici, esistono almeno l valori distinti per ciascun attributo sensibile.
Puoi calcolare il valore di l-diversity in base a una o più colonne o campi di un set di dati. Questo argomento mostra come calcolare i valori di l-diversity per un set di dati utilizzando Sensitive Data Protection. Per ulteriori informazioni su l-diversity o sull'analisi del rischio in generale, consulta l'argomento sui concetti di analisi del rischio prima di continuare.
Prima di iniziare
Prima di continuare, assicurati di aver eseguito le seguenti operazioni:
- Accedi al tuo Account Google.
- Nella Google Cloud console, nella pagina di selezione del progetto, seleziona o crea un Google Cloud progetto. Vai al selettore di progetti
- Verifica che la fatturazione sia attivata per il tuo Google Cloud progetto. Scopri come verificare che la fatturazione sia attivata per il tuo progetto.
- Abilita Sensitive Data Protection. Abilita Sensitive Data Protection
- Seleziona un set di dati BigQuery da analizzare. Sensitive Data Protection calcola la metrica l-diversity eseguendo la scansione di una tabella BigQuery.
- Determina un identificatore di campo sensibile (se applicabile) e almeno un quasi-identificatore nel set di dati. Per ulteriori informazioni, consulta Termini e tecniche di analisi del rischio.
Calcola l-diversity
Sensitive Data Protection esegue l'analisi del rischio ogni volta che viene eseguito un job di analisi del rischio. Devi prima creare il job utilizzando la Google Cloud console, inviando una richiesta all'API DLP o utilizzando una libreria client di Sensitive Data Protection.
Console
Nella Google Cloud console, vai alla pagina Crea analisi del rischio.
Nella sezione Scegli dati di input, specifica la tabella BigQuery da scansionare inserendo l'ID progetto del progetto contenente la tabella, l'ID set di dati della tabella e il nome della tabella.
In Metrica di privacy da calcolare, seleziona l-diversity.
Nella sezione ID job, puoi facoltativamente assegnare al job un identificatore personalizzato e selezionare una località delle risorse in cui Sensitive Data Protection elaborerà i tuoi dati. Al termine, fai clic su Continua.
Nella sezione Definisci campi, specifica i campi sensibili e quasi-identificatori per il job di rischio l-diversity. Sensitive Data Protection accede ai metadati della tabella BigQuery specificata nel passaggio precedente e tenta di compilare l'elenco dei campi.
- Seleziona la casella di controllo appropriata per specificare un campo come campo sensibile (S) o quasi-identificatore (QI). Devi selezionare 1 campo sensibile e almeno 1 quasi-identificatore.
- Se Sensitive Data Protection non è in grado di compilare i campi, fai clic su Inserisci nome campo per inserire manualmente uno o più campi e impostare ciascuno come campo sensibile o quasi-identificatore. Al termine, fai clic su Continua.
Nella sezione Aggiungi azioni, puoi aggiungere azioni facoltative da eseguire al termine del job di rischio. Le opzioni disponibili sono:
- Salva in BigQuery: salva i risultati della scansione di analisi del rischio in una tabella BigQuery.
Pubblica in Pub/Sub: pubblica una notifica in un argomento Pub/Sub.
Invia notifica via email: ti invia un'email con i risultati. Al termine, fai clic su Crea.
Il job di analisi del rischio l-diversity viene avviato immediatamente.
C#
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Go
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
PHP
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per eseguire l'autenticazione in Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
REST
Per eseguire un nuovo job di analisi del rischio per calcolare l-diversity, invia una richiesta alla
projects.dlpJobs
risorsa, dove PROJECT_ID indica l'identificatore
del progetto:
https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs
La richiesta contiene un
RiskAnalysisJobConfig
oggetto, composto da quanto segue:
Un
PrivacyMetricoggetto. Qui specifichi che stai calcolando l-diversity includendo unLDiversityConfigoggetto.Un
BigQueryTableoggetto. Specifica la tabella BigQuery da scansionare includendo tutti gli elementi seguenti:projectId: l'ID progetto del progetto contenente la tabella.datasetId: l'ID set di dati della tabella.tableId: il nome della tabella.
Un insieme di uno o più
Actionoggetti, che rappresentano le azioni da eseguire, nell'ordine indicato, al termine del job. Ogni oggettoActionpuò contenere una delle seguenti azioni:SaveFindingsoggetto: salva i risultati della scansione di analisi del rischio in una tabella BigQuery.PublishToPubSuboggetto: pubblica una notifica in un argomento Pub/Sub.JobNotificationEmailsoggetto: ti invia un'email con i risultati.
Nell'
LDiversityConfigoggetto, specifica quanto segue:quasiIds[]: un insieme di quasi-identificatori (oggettiFieldId`FieldId`) che indicano come vengono definite le classi di equivalenza per il calcolo di l-diversity. Come perKAnonymityConfig, quando specifichi più campi, questi vengono considerati una singola chiave composta.sensitiveAttribute: campo sensibile (FieldIdoggetto) per il calcolo del valore di l-diversity.
Non appena invii una richiesta all'API DLP, viene avviato il job di analisi del rischio.
Elenca i job di analisi del rischio completati
Puoi visualizzare un elenco dei job di analisi del rischio eseguiti nel progetto corrente.
Console
Per elencare i job di analisi del rischio in esecuzione e quelli eseguiti in precedenza nella Google Cloud console, procedi nel seguente modo:
Nella Google Cloud console, apri Sensitive Data Protection.
Fai clic sulla scheda Job e trigger job nella parte superiore della pagina.
Fai clic sulla scheda Job di rischio.
Viene visualizzata l'offerta di lavoro a rischio.
Protocollo
Per elencare i job di analisi del rischio in esecuzione e quelli eseguiti in precedenza, invia una richiesta GET a
the
projects.dlpJobs
risorsa. L'aggiunta di un filtro del tipo di prestazione (?type=RISK_ANALYSIS_JOB) limita la risposta ai soli job di analisi del rischio.
https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs?type=RISK_ANALYSIS_JOB
La risposta che ricevi contiene una rappresentazione JSON di tutti i job di analisi del rischio correnti e precedenti.
Visualizza i risultati del job di l-diversity
Sensitive Data Protection nella Google Cloud console include visualizzazioni integrate per i job di l-diversity completati. Dopo aver seguito le istruzioni nella sezione precedente, dall'elenco dei job di analisi del rischio, seleziona il job di cui vuoi visualizzare i risultati. Supponendo che il job sia stato eseguito correttamente, la parte superiore della pagina Dettagli analisi del rischio avrà il seguente aspetto:

Nella parte superiore della pagina sono riportate le informazioni sul job di rischio l-diversity, incluso l'ID job e, in Contenitore, la località della risorsa.
Per visualizzare i risultati del calcolo di l-diversity, fai clic sulla scheda L-diversity. Per visualizzare la configurazione del job di analisi del rischio, fai clic sulla scheda Configurazione.
La scheda L-diversity elenca innanzitutto il valore sensibile e i quasi-identificatori utilizzati per calcolare l-diversity.
Grafico del rischio
Il grafico Rischio di reidentificazione traccia, sull'asse y, la potenziale percentuale di perdita di dati sia per le righe univoche sia per le combinazioni univoche di quasi-identificatori per ottenere, sull'asse x, un valore di l-diversity. Il colore del grafico indica anche il potenziale di rischio. Le tonalità di blu più scure indicano un rischio maggiore, mentre quelle più chiare indicano un rischio minore.
Valori di l-diversity più elevati indicano una minore diversità di valori, il che può rendere un set di dati meno reidentificabile e più sicuro. Tuttavia, per ottenere valori di l-diversity più elevati, dovresti rimuovere percentuali maggiori del totale delle righe e combinazioni univoche di quasi-identificatori, il che potrebbe ridurre l' utilità dei dati. Per visualizzare un valore di perdita percentuale potenziale specifico per un determinato l-diversity, passa il cursore sopra il grafico. Come mostrato nello screenshot, sul grafico viene visualizzata una descrizione comando.
Per visualizzare maggiori dettagli su un valore di l-diversity specifico, fai clic sul punto dati corrispondente. Sotto il grafico viene visualizzata una spiegazione dettagliata e più in basso nella pagina viene visualizzata una tabella di dati di esempio.
Tabella di dati di esempio del rischio
Il secondo componente della pagina dei risultati del job di rischio è la tabella di dati di esempio. Mostra le combinazioni di quasi-identificatori per un determinato valore di l-diversity di destinazione.

La prima colonna della tabella elenca i valori di k-anonymity. Fai clic su un valore di l-diversity per visualizzare i dati di esempio corrispondenti che dovrebbero essere eliminati per ottenere quel valore.
La seconda colonna mostra la rispettiva potenziale perdita di dati di righe univoche e combinazioni di quasi-identificatori per ottenere il valore di l-diversity selezionato, nonché il numero di gruppi con almeno l attributi sensibili e il numero totale di record.
L'ultima colonna mostra un campione di gruppi che condividono una combinazione di quasi-identificatori, insieme al numero di record esistenti per quella combinazione.
Recupera i dettagli del job utilizzando REST
Per recuperare i risultati del l-diversity job di analisi del rischio utilizzando l'API
REST, invia la seguente richiesta GET alla
projects.dlpJobs
risorsa. Sostituisci PROJECT_ID con l'ID progetto e
JOB_ID con l'identificatore del job di cui vuoi ottenere i risultati.
L'ID job è stato restituito all'avvio del job e può essere recuperato anche
elencando tutti i job.
GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID
La richiesta restituisce un oggetto JSON contenente un'istanza del job. I risultati
dell'analisi si trovano all'interno della chiave "riskDetails", in un
AnalyzeDataSourceRiskDetails
oggetto. Per ulteriori informazioni, consulta il riferimento API per la
DlpJob
risorsa.
Passaggi successivi
- Scopri come calcolare il valore di k-anonymity per un set di dati.
- Scopri come calcolare il k-map valore per un set di dati.
- Scopri come calcolare il δ-presence valore per un set di dati.