Introduzione a Cloud Data Fusion: console

Questa pagina introduce Cloud Data Fusion: Console, noto anche come piano di controllo. Si tratta di un insieme di operazioni API e di un'interfaccia della Google Cloud console che ti consentono di gestire un'istanza Cloud Data Fusion. Ad esempio, utilizzando la console, puoi creare, eliminare, riavviare o aggiornare un'istanza.

Prima di iniziare

Panoramica di Cloud Data Fusion: Console

Le sezioni seguenti descrivono gli aspetti importanti della console.

Istanze

Un' istanza è un deployment univoco di Cloud Data Fusion. Per iniziare a utilizzare Cloud Data Fusion, crea un'istanza nella Google Cloud console. Puoi creare più istanze Cloud Data Fusion in un singolo Google Cloud progetto. Puoi specificare una Google Cloud regione per ogni istanza. Ogni istanza è un deployment di Cloud Data Fusion univoco e indipendente, che contiene un insieme di servizi che gestiscono la gestione del ciclo di vita, l'orchestrazione, il coordinamento e la gestione dei metadati delle pipeline. Questi servizi vengono eseguiti utilizzando risorse a lunga esecuzione in un progetto tenant.

Quando crei l'istanza, tieni presente le seguenti opzioni.

Edizione

Crea l'istanza in una delle seguenti versioni di Cloud Data Fusion: Developer, Basic o Enterprise. Scegli la versione in base ai seguenti criteri:

  • Costo
  • Limiti di simultaneità per l'esecuzione della pipeline
  • Disponibilità del controllo dell'accesso basato sui ruoli (RBAC)

Le versioni sono destinate ai seguenti casi d'uso:

Versione di Cloud Data Fusion Caso d'uso
Edizione Developer Per lo sviluppo, i test o le integrazioni su piccola scala
Edizione Basic Per la produzione con esigenze moderate
Edizione Enterprise Per pipeline di dati mission critical su larga scala con RBAC

Istanza pubblica o privata

A seconda dei requisiti, decidi se hai bisogno di un'istanza pubblica o privata. Le principali differenze tra le istanze private e pubbliche in Cloud Data Fusion sono la connettività di rete e la sicurezza:

Tipo di istanza Cloud Data Fusion Comportamento
Istanza pubblica
  • Connettività di rete: utilizza indirizzi IP pubblici per connettersi a internet.
  • Accesso ai dati: accede direttamente alle origini dati su internet pubblico.
Per saperne di più, vedi Creare un'istanza pubblica.
Istanza privata
  • Connettività di rete: utilizza indirizzi IP privati all'interno di una rete Virtual Private Cloud (VPC).
  • Accesso ai dati: richiede connessioni preconfigurate per accedere alle origini dati. Sono supportate le seguenti connessioni:
    • Origini dati on-premise connesse tramite VPN o Cloud Interconnect.
    • Altri Google Cloud servizi in esecuzione in privato all'interno dello stesso VPC.

Autorizzazione e account di servizio

In genere, Cloud Data Fusion ha due service account:

Account di servizio di progettazione
Questo account di servizio gestito da Google, chiamato service agent dell'API Data Fusion, viene utilizzato nel progetto tenant di Cloud Data Fusion per accedere alle risorse del progetto cliente.
Account di servizio di runtime
Questo è il account di servizio Compute Engine predefinito che Cloud Data Fusion crea per eseguire il deployment dei job che accedono ad altre Google Cloud risorse. Per impostazione predefinita, si collega a una VM del cluster Managed Service for Apache Spark per consentire a Cloud Data Fusion di accedere alle risorse di Managed Service for Apache Spark durante l'esecuzione di una pipeline.

Per saperne di più, vedi Service account in Cloud Data Fusion.

Logging e monitoraggio

Cloud Logging e Cloud Monitoring sono fondamentali per ottenere informazioni sull'integrità e sulle prestazioni delle pipeline di Cloud Data Fusion. Abiliti Logging e Monitoring solo quando crei l'istanza Cloud Data Fusion.

L'abilitazione di Logging e Monitoring ti consente di visualizzare i log delle pipeline di Cloud Data Fusion nella Google Cloud console nella pagina Visualizzatore log.

Monitoring fornisce dashboard integrate per Cloud Data Fusion. Puoi anche creare dashboard personalizzate per monitorare metriche specifiche.

Integrazione della derivazione con Knowledge Catalog

Cloud Data Fusion fornisce un'integrazione con Knowledge Catalog per la derivazione. Per saperne di più, vedi Visualizzare la derivazione in Knowledge Catalog.

Crittografia

Le chiavi di crittografia gestite dal cliente (CMEK) consentono la crittografia dei dati at-rest con una chiave che puoi controllare tramite Cloud Key Management Service. CMEK fornisce all'utente il controllo sui dati scritti nelle risorse interne nei progetti tenant e sui dati scritti dalle pipeline di Cloud Data Fusion. Google Cloud Per saperne di più, vedi Crittografia dei dati gestita dal cliente.

Gestire le autorizzazioni con il controllo dell'accesso basato sui ruoli (RBAC)

Cloud Data Fusion ti consente di controllare con Identity and Access Management (IAM).

Per autorizzazioni granulari per le azioni eseguite in Cloud Data Fusion: operazioni di Studio, utilizza RBAC. Per saperne di più, vedi la panoramica di RBAC.

Upgrade della versione

Cloud Data Fusion ha versioni. Puoi eseguire l'upgrade di un'istanza a una versione successiva nella console Cloud Data Fusion. Per saperne di più, vedi Controllo delle versioni in Cloud Data Fusion.

Passaggi successivi