Considerazioni sulla derivazione dei dati

Questo documento fornisce informazioni sulla conformità e sulle limitazioni della derivazione dei dati. La derivazione dei dati è abilitata per progetto, non per sistema. Ciò significa che dopo aver abilitato l'API Data Lineage, le informazioni sulla derivazione possono essere segnalate automaticamente per più sistemi nel progetto, a seconda del controllo della derivazione a livello di prodotto di ciascun sistema.

Il monitoraggio automatico della derivazione è supportato per i seguenti sistemi:

Controlli della derivazione a livello di prodotto nei Google Cloud sistemi supportati
Sistema Controlli di derivazione disponibili
BigQuery,
Cloud Data Fusion
Non è possibile configurare il monitoraggio della derivazione in modo che sia limitato solo a Cloud Data Fusion o BigQuery quando l'API Data Lineage è abilitata in un progetto.
Managed Service for Apache Airflow Managed Airflow utilizza il controllo dell'integrazione della lineage dei dati a livello di ambiente. La derivazione dei dati viene attivata automaticamente per tutti i nuovi ambienti Managed Airflow, a condizione che soddisfino i requisiti. Per saperne di più, consulta Derivazione dei dati con Knowledge Catalog (in precedenza Dataplex Universal Catalog). Per gli ambienti esistenti, puoi attivare o disattivare l'integrazione della lineage dei dati nelle impostazioni dell'ambiente.
Dataflow I job Dataflow possono acquisire eventi di derivazione e pubblicarli nell'API Data Lineage. Per ulteriori informazioni, consulta Utilizzare la lineage dei dati in Dataflow.
Managed Service for Apache Spark I job Managed Service for Apache Spark possono acquisire eventi di derivazione e pubblicarli nell'API Data Lineage. Per maggiori informazioni, consulta Utilizzo della lineage dei dati Spark.
Looker (Google Cloud core) (anteprima) I metadati di Looker (Google Cloud core) delle origini BigQuery possono essere visualizzati utilizzando la derivazione dei dati. La lineage dei dati deve essere abilitata a livello di risorsa Looker (Google Cloud core) e a livello di servizio di lineage dei dati. Per ulteriori informazioni, consulta Monitorare la derivazione dei dati con Knowledge Catalog.
Vertex AI La derivazione dei dati viene attivata automaticamente per gli artefatti e i parametri di Vertex AI, come modelli, set di dati, modelli di pipeline e componenti. La derivazione di una pipeline include i fattori che hanno contribuito alla sua creazione, nonché gli artefatti e i metadati derivati successivamente. Per saperne di più, consulta Monitoraggio della derivazione degli artefatti della pipeline.

Impatto sulla fatturazione

Quando abiliti l'API Data Lineage in un progetto, esamina l'impatto sugli addebiti di fatturazione, perché l'API Data Lineage è abilitata in base al progetto (per i dettagli, consulta la sezione precedente). Per ulteriori informazioni su come viene addebitata la derivazione dei dati, consulta Prezzi di Knowledge Catalog.

Per BigQuery Omni, l'elaborazione della derivazione viene distribuita a regioni specifiche e i costi dipendono dalle regioni in cui viene eseguita l'elaborazione.

Conformità della derivazione dei dati

  • La derivazione dei dati registra i metadati relativi allo spostamento dei dati, ma non acquisisce i dati stessi. Consulta il modello informativo della derivazione dei dati e il riferimento API Data Lineage per informazioni dettagliate sui campi inclusi nei metadati.
  • La derivazione dei dati nell'ambito di Knowledge Catalog offre il supporto di VPC-SC.
  • Knowledge Catalog non offre la possibilità di utilizzare le chiavi di crittografia gestite dal cliente per proteggere i metadati della derivazione raccolti.

Limitazioni della derivazione dei dati

Quando selezioni un nodo nel grafico della derivazione, il riquadro laterale dei dettagli del nodo sarà vuoto nei seguenti casi:

  • La risorsa si trova in un'altra organizzazione.
  • L'utente non è membro dell'organizzazione che ospita la risorsa.