Calcolo di δ-presence per un set di dati

La delta-presence (δ-presence) è una metrica che quantifica la probabilità che un individuo appartenga a un set di dati analizzato. Come k-map, puoi stimare i valori di δ-presence utilizzando Sensitive Data Protection, che utilizza un modello statistico per stimare il set di dati di attacco.

δ-presence contrasta con gli altri metodi di analisi del rischio, in cui il set di dati di attacco è noto in modo esplicito. A seconda del tipo di dati, Sensitive Data Protection utilizza set di dati disponibili pubblicamente (ad esempio, dal censimento statunitense) o un modello statistico personalizzato (ad esempio, una o più tabelle BigQuery che specifichi) oppure estrapola dalla distribuzione dei valori nel set di dati di input.

Questo argomento mostra come calcolare i valori di δ-presence per un set di dati utilizzando Sensitive Data Protection. Prima di continuare, per saperne di più su δ-presence o sull'analisi del rischio in generale, consulta l'argomento sui concetti di analisi del rischio.

Prima di iniziare

Prima di continuare, assicurati di aver eseguito le seguenti operazioni:

  1. Accedi al tuo Account Google.
  2. Nella Google Cloud console, nella pagina di selezione del progetto, seleziona o crea un Google Cloud progetto.
  3. Vai al selettore di progetti
  4. Verifica che la fatturazione sia abilitata per il tuo Google Cloud progetto. Scopri come verificare che la fatturazione sia abilitata per il tuo progetto.
  5. Abilita Sensitive Data Protection.
  6. Abilita Sensitive Data Protection

  7. Seleziona un set di dati BigQuery da analizzare. Sensitive Data Protection stima la metrica δ-presence eseguendo la scansione di una tabella BigQuery.
  8. Determina i tipi di set di dati che vuoi utilizzare per modellare il set di dati di attacco dataset. Per saperne di più, consulta la pagina di riferimento per l' DeltaPresenceEstimationConfig oggetto, nonché i termini e le tecniche di analisi del rischio.

Calcolare le metriche di δ-presence

Per calcolare una stima di δ-presence utilizzando Sensitive Data Protection, invia una richiesta al seguente URL, dove PROJECT_ID indica l'identificatore del progetto :

https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs

La richiesta contiene un RiskAnalysisJobConfig oggetto, composto da quanto segue:

  • Un PrivacyMetric oggetto. Qui specifichi che vuoi calcolare δ-presence specificando un oggetto contenente quanto segue:DeltaPresenceEstimationConfig

    • quasiIds[]: obbligatorio. Campi (QuasiId oggetti) considerati quasi-identificatori da scansionare e utilizzare per calcolare δ-presence. Due colonne non possono avere lo stesso tag. Questi possono essere uno dei seguenti:

      • Un infoType: Sensitive Data Protection utilizza il set di dati pubblico pertinente come modello statistico della popolazione, inclusi codici postali, codici regione, età e generi degli Stati Uniti.
      • Un infoType personalizzato: un tag personalizzato in cui indichi una tabella ausiliaria (un AuxiliaryTable oggetto) che contiene informazioni statistiche sui possibili valori di questa colonna.
      • Il tag inferred: se non viene indicato alcun tag semantico, specifica inferred. Sensitive Data Protection deduce il modello statistico dalla distribuzione dei valori nei dati di input.
    • regionCode: un codice regione ISO 3166-1 alpha-2 da utilizzare in Sensitive Data Protection per la modellazione statistica. Questo valore è obbligatorio se nessuna colonna è taggata con un infoType specifico della regione (ad esempio, un codice postale statunitense) o un codice regione.

    • auxiliaryTables[]: tabelle ausiliarie (StatisticalTable oggetti) da utilizzare nell'analisi. Ogni tag personalizzato utilizzato per taggare una colonna quasi-identificatore (da quasiIds[]) deve essere presente in una sola colonna di una tabella ausiliaria.

  • Un BigQueryTable oggetto. Specifica la tabella BigQuery da scansionare includendo tutti i seguenti elementi:

    • projectId: l'ID progetto del progetto contenente la tabella.
    • datasetId: l'ID set di dati della tabella.
    • tableId: il nome della tabella.
  • Un insieme di uno o più Action oggetti, che rappresentano le azioni da eseguire, nell'ordine indicato, al completamento del job. Ogni oggetto Action può contenere una delle seguenti azioni:

Visualizzare i risultati del job di δ-presence

Per recuperare i risultati del δ-presence risk analysis job utilizzando l'API REST, invia la seguente richiesta GET alla projects.dlpJobs risorsa. Sostituisci PROJECT_ID con l'ID progetto e JOB_ID con l'identificatore del job di cui vuoi ottenere i risultati. L'ID job è stato restituito all'avvio del job e può essere recuperato anche elencando tutti i job.

GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID

La richiesta restituisce un oggetto JSON contenente un'istanza del job. I risultati dell'analisi si trovano all'interno della chiave "riskDetails", in un AnalyzeDataSourceRiskDetails oggetto. Per saperne di più, consulta il riferimento API per la DlpJob risorsa.

Passaggi successivi

  • Scopri come calcolare il valore di k-anonymity per un set di dati.
  • Scopri come calcolare il valore di _l_ -diversity per un set di dati.
  • Scopri come calcolare il k-map valore per un set di dati.