Questa pagina introduce Cloud Data Fusion: Console, noto anche come piano di controllo. Si tratta di un insieme di operazioni API e di un'interfaccia della Google Cloud console che ti consentono di gestire un'istanza Cloud Data Fusion. Ad esempio, utilizzando la console, puoi creare, eliminare, riavviare o aggiornare un'istanza.
Prima di iniziare
- Abilita l'API Data Fusion.
- Comprendi i costi delle versioni di Cloud Data Fusion.
- Comprendi il controllo dell'accesso e i service account in Cloud Data Fusion.
Panoramica di Cloud Data Fusion: Console
Le sezioni seguenti descrivono gli aspetti importanti della console.
Istanze
Un' istanza è un deployment univoco di Cloud Data Fusion. Per iniziare a utilizzare Cloud Data Fusion, crea un'istanza nella Google Cloud console. Puoi creare più istanze Cloud Data Fusion in un singolo Google Cloud progetto. Puoi specificare una Google Cloud regione per ogni istanza. Ogni istanza è un deployment di Cloud Data Fusion univoco e indipendente, che contiene un insieme di servizi che gestiscono la gestione del ciclo di vita, l'orchestrazione, il coordinamento e la gestione dei metadati delle pipeline. Questi servizi vengono eseguiti utilizzando risorse a lunga esecuzione in un progetto tenant.
Quando crei l'istanza, tieni presente le seguenti opzioni.
Edizione
Crea l'istanza in una delle seguenti versioni di Cloud Data Fusion: Developer, Basic o Enterprise. Scegli la versione in base ai seguenti criteri:
- Costo
- Limiti di simultaneità per l'esecuzione della pipeline
- Disponibilità del controllo dell'accesso basato sui ruoli (RBAC)
Le versioni sono destinate ai seguenti casi d'uso:
| Versione di Cloud Data Fusion | Caso d'uso |
|---|---|
| Edizione Developer | Per lo sviluppo, i test o le integrazioni su piccola scala |
| Edizione Basic | Per la produzione con esigenze moderate |
| Edizione Enterprise | Per pipeline di dati mission critical su larga scala con RBAC |
Istanza pubblica o privata
A seconda dei requisiti, decidi se hai bisogno di un'istanza pubblica o privata. Le principali differenze tra le istanze private e pubbliche in Cloud Data Fusion sono la connettività di rete e la sicurezza:
| Tipo di istanza Cloud Data Fusion | Comportamento |
|---|---|
| Istanza pubblica |
|
| Istanza privata |
|
Autorizzazione e account di servizio
In genere, Cloud Data Fusion ha due service account:
- Account di servizio di progettazione
- Questo account di servizio gestito da Google, chiamato service agent dell'API Data Fusion, viene utilizzato nel progetto tenant di Cloud Data Fusion per accedere alle risorse del progetto cliente.
- Account di servizio di runtime
- Questo è il account di servizio Compute Engine predefinito che Cloud Data Fusion crea per eseguire il deployment dei job che accedono ad altre Google Cloud risorse. Per impostazione predefinita, si collega a una VM del cluster Managed Service for Apache Spark per consentire a Cloud Data Fusion di accedere alle risorse di Managed Service for Apache Spark durante l'esecuzione di una pipeline.
Per saperne di più, vedi Service account in Cloud Data Fusion.
Logging e monitoraggio
Cloud Logging e Cloud Monitoring sono fondamentali per ottenere informazioni sull'integrità e sulle prestazioni delle pipeline di Cloud Data Fusion. Abiliti Logging e Monitoring solo quando crei l'istanza Cloud Data Fusion.
L'abilitazione di Logging e Monitoring ti consente di visualizzare i log delle pipeline di Cloud Data Fusion nella Google Cloud console nella pagina Visualizzatore log.
Monitoring fornisce dashboard integrate per Cloud Data Fusion. Puoi anche creare dashboard personalizzate per monitorare metriche specifiche.
Integrazione della derivazione con Knowledge Catalog
Cloud Data Fusion fornisce un'integrazione con Knowledge Catalog per la derivazione. Per saperne di più, vedi Visualizzare la derivazione in Knowledge Catalog.
Crittografia
Le chiavi di crittografia gestite dal cliente (CMEK) consentono la crittografia dei dati at-rest con una chiave che puoi controllare tramite Cloud Key Management Service. CMEK fornisce all'utente il controllo sui dati scritti nelle risorse interne nei progetti tenant e sui dati scritti dalle pipeline di Cloud Data Fusion. Google Cloud Per saperne di più, vedi Crittografia dei dati gestita dal cliente.
Gestire le autorizzazioni con il controllo dell'accesso basato sui ruoli (RBAC)
Cloud Data Fusion ti consente di controllare con Identity and Access Management (IAM).
Per autorizzazioni granulari per le azioni eseguite in Cloud Data Fusion: operazioni di Studio, utilizza RBAC. Per saperne di più, vedi la panoramica di RBAC.
Upgrade della versione
Cloud Data Fusion ha versioni. Puoi eseguire l'upgrade di un'istanza a una versione successiva nella console Cloud Data Fusion. Per saperne di più, vedi Controllo delle versioni in Cloud Data Fusion.
Passaggi successivi
- Scopri di più su Cloud Data Fusion: Studio.