La delta-presence (δ-presence) è una metrica che quantifica la probabilità che un individuo appartenga a un set di dati analizzato. Come k-map, puoi stimare i valori di δ-presence utilizzando Sensitive Data Protection, che utilizza un modello statistico per stimare il set di dati di attacco.
δ-presence contrasta con gli altri metodi di analisi del rischio, in cui il set di dati di attacco è noto in modo esplicito. A seconda del tipo di dati, Sensitive Data Protection utilizza set di dati disponibili pubblicamente (ad esempio, dal censimento statunitense) o un modello statistico personalizzato (ad esempio, una o più tabelle BigQuery che specifichi) oppure estrapola dalla distribuzione dei valori nel set di dati di input.
Questo argomento mostra come calcolare i valori di δ-presence per un set di dati utilizzando Sensitive Data Protection. Prima di continuare, per saperne di più su δ-presence o sull'analisi del rischio in generale, consulta l'argomento sui concetti di analisi del rischio.
Prima di iniziare
Prima di continuare, assicurati di aver eseguito le seguenti operazioni:
- Accedi al tuo Account Google.
- Nella Google Cloud console, nella pagina di selezione del progetto, seleziona o crea un Google Cloud progetto. Vai al selettore di progetti
- Verifica che la fatturazione sia abilitata per il tuo Google Cloud progetto. Scopri come verificare che la fatturazione sia abilitata per il tuo progetto.
- Abilita Sensitive Data Protection. Abilita Sensitive Data Protection
- Seleziona un set di dati BigQuery da analizzare. Sensitive Data Protection stima la metrica δ-presence eseguendo la scansione di una tabella BigQuery.
- Determina i tipi di set di dati che vuoi utilizzare per modellare il set di dati di attacco
dataset. Per saperne di più, consulta la pagina di riferimento per l'
DeltaPresenceEstimationConfigoggetto, nonché i termini e le tecniche di analisi del rischio.
Calcolare le metriche di δ-presence
Per calcolare una stima di δ-presence utilizzando Sensitive Data Protection, invia una richiesta al seguente URL, dove PROJECT_ID indica l'identificatore del progetto :
https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs
La richiesta contiene un
RiskAnalysisJobConfig
oggetto, composto da quanto segue:
Un
PrivacyMetricoggetto. Qui specifichi che vuoi calcolare δ-presence specificando un oggetto contenente quanto segue:DeltaPresenceEstimationConfigquasiIds[]: obbligatorio. Campi (QuasiIdoggetti) considerati quasi-identificatori da scansionare e utilizzare per calcolare δ-presence. Due colonne non possono avere lo stesso tag. Questi possono essere uno dei seguenti:- Un infoType: Sensitive Data Protection utilizza il set di dati pubblico pertinente come modello statistico della popolazione, inclusi codici postali, codici regione, età e generi degli Stati Uniti.
- Un infoType personalizzato: un tag personalizzato in cui indichi una tabella ausiliaria
(un
AuxiliaryTableoggetto) che contiene informazioni statistiche sui possibili valori di questa colonna. - Il tag
inferred: se non viene indicato alcun tag semantico, specificainferred. Sensitive Data Protection deduce il modello statistico dalla distribuzione dei valori nei dati di input.
regionCode: un codice regione ISO 3166-1 alpha-2 da utilizzare in Sensitive Data Protection per la modellazione statistica. Questo valore è obbligatorio se nessuna colonna è taggata con un infoType specifico della regione (ad esempio, un codice postale statunitense) o un codice regione.auxiliaryTables[]: tabelle ausiliarie (StatisticalTableoggetti) da utilizzare nell'analisi. Ogni tag personalizzato utilizzato per taggare una colonna quasi-identificatore (daquasiIds[]) deve essere presente in una sola colonna di una tabella ausiliaria.
Un
BigQueryTableoggetto. Specifica la tabella BigQuery da scansionare includendo tutti i seguenti elementi:projectId: l'ID progetto del progetto contenente la tabella.datasetId: l'ID set di dati della tabella.tableId: il nome della tabella.
Un insieme di uno o più
Actionoggetti, che rappresentano le azioni da eseguire, nell'ordine indicato, al completamento del job. Ogni oggettoActionpuò contenere una delle seguenti azioni:SaveFindingsoggetto: salva i risultati della scansione di analisi del rischio in una tabella BigQuery.PublishToPubSuboggetto: pubblica una notifica in un argomento Pub/Sub.
PublishSummaryToCsccoggetto: salva un riepilogo dei risultati in Security Command Center.PublishFindingsToCloudDataCatalogoggetto: salva i risultati in Data Catalog.JobNotificationEmailsoggetto: ti invia un'email con i risultati.PublishToStackdriveroggetto: salva i risultati in Google Cloud Observability.
Visualizzare i risultati del job di δ-presence
Per recuperare i risultati del δ-presence risk analysis job utilizzando l'API
REST, invia la seguente richiesta GET alla
projects.dlpJobs
risorsa. Sostituisci PROJECT_ID con l'ID progetto e
JOB_ID con l'identificatore del job di cui vuoi ottenere i risultati.
L'ID job è stato restituito all'avvio del job e può essere recuperato anche
elencando tutti i job.
GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID
La richiesta restituisce un oggetto JSON contenente un'istanza del job. I risultati
dell'analisi si trovano all'interno della chiave "riskDetails", in un
AnalyzeDataSourceRiskDetails
oggetto. Per saperne di più, consulta il riferimento API per la
DlpJob
risorsa.
Passaggi successivi
- Scopri come calcolare il valore di k-anonymity per un set di dati.
- Scopri come calcolare il valore di _l_ -diversity per un set di dati.
- Scopri come calcolare il k-map valore per un set di dati.