Questo documento fornisce informazioni sulla conformità e sulle limitazioni della derivazione dei dati. La derivazione dei dati è abilitata per progetto, non per sistema. Ciò significa che dopo aver abilitato l'API Data Lineage, le informazioni sulla derivazione possono essere segnalate automaticamente per più sistemi nel progetto, a seconda del controllo della derivazione a livello di prodotto di ciascun sistema.
Il monitoraggio automatico della derivazione è supportato per i seguenti sistemi:
| Sistema | Controlli di derivazione disponibili |
|---|---|
| BigQuery, Cloud Data Fusion |
Non è possibile configurare il monitoraggio della derivazione in modo che sia limitato solo a Cloud Data Fusion o BigQuery quando l'API Data Lineage è abilitata in un progetto. |
| Managed Service for Apache Airflow | Managed Airflow utilizza il controllo dell'integrazione della lineage dei dati a livello di ambiente. La derivazione dei dati viene attivata automaticamente per tutti i nuovi ambienti Managed Airflow, a condizione che soddisfino i requisiti. Per saperne di più, consulta Derivazione dei dati con Knowledge Catalog (in precedenza Dataplex Universal Catalog). Per gli ambienti esistenti, puoi attivare o disattivare l'integrazione della lineage dei dati nelle impostazioni dell'ambiente. |
| Dataflow | I job Dataflow possono acquisire eventi di derivazione e pubblicarli nell'API Data Lineage. Per ulteriori informazioni, consulta Utilizzare la lineage dei dati in Dataflow. |
| Managed Service for Apache Spark | I job Managed Service for Apache Spark possono acquisire eventi di derivazione e pubblicarli nell'API Data Lineage. Per maggiori informazioni, consulta Utilizzo della lineage dei dati Spark. |
| Looker (Google Cloud core) (anteprima) | I metadati di Looker (Google Cloud core) delle origini BigQuery possono essere visualizzati utilizzando la derivazione dei dati. La lineage dei dati deve essere abilitata a livello di risorsa Looker (Google Cloud core) e a livello di servizio di lineage dei dati. Per ulteriori informazioni, consulta Monitorare la derivazione dei dati con Knowledge Catalog. |
| Vertex AI | La derivazione dei dati viene attivata automaticamente per gli artefatti e i parametri di Vertex AI, come modelli, set di dati, modelli di pipeline e componenti. La derivazione di una pipeline include i fattori che hanno contribuito alla sua creazione, nonché gli artefatti e i metadati derivati successivamente. Per saperne di più, consulta Monitoraggio della derivazione degli artefatti della pipeline. |
Impatto sulla fatturazione
Quando abiliti l'API Data Lineage in un progetto, esamina l'impatto sugli addebiti di fatturazione, perché l'API Data Lineage è abilitata in base al progetto (per i dettagli, consulta la sezione precedente). Per ulteriori informazioni su come viene addebitata la derivazione dei dati, consulta Prezzi di Knowledge Catalog.
Per BigQuery Omni, l'elaborazione della derivazione viene distribuita a regioni specifiche e i costi dipendono dalle regioni in cui viene eseguita l'elaborazione.
Conformità della derivazione dei dati
- La derivazione dei dati registra i metadati relativi allo spostamento dei dati, ma non acquisisce i dati stessi. Consulta il modello informativo della derivazione dei dati e il riferimento API Data Lineage per informazioni dettagliate sui campi inclusi nei metadati.
- La derivazione dei dati nell'ambito di Knowledge Catalog offre il supporto di VPC-SC.
- Knowledge Catalog non offre la possibilità di utilizzare le chiavi di crittografia gestite dal cliente per proteggere i metadati della derivazione raccolti.
Limitazioni della derivazione dei dati
Quando selezioni un nodo nel grafico della derivazione, il riquadro laterale dei dettagli del nodo sarà vuoto nei seguenti casi:
- La risorsa si trova in un'altra organizzazione.
- L'utente non è membro dell'organizzazione che ospita la risorsa.