Questa pagina spiega come creare un'istanza Cloud Data Fusion .
Prima di iniziare
- Abilita l'API Data Fusion.
- Per creare istanze Cloud Data Fusion è necessaria la seguente autorizzazione:
instances.create. Per ulteriori informazioni, consulta Controllo dell'accesso. - Le istanze Cloud Data Fusion vengono eseguite come l'account di servizio predefinito di Compute Engine. Per informazioni sui tipi e sui ruoli disponibili, consulta Account di servizio.
- Per impostazione predefinita, Cloud Data Fusion esegue le pipeline utilizzando un cluster Managed Service for Apache Spark nel tuo progetto. Assicurati che il tuo progetto soddisfi i requisiti di rete di Managed Service for Apache Spark.
- I nuovi progetti vengono avviati con una rete predefinita. La rete predefinita è precompilata con una regola firewall default-allow-ssh, che consente le connessioni in entrata sulla porta TCP 22 da qualsiasi origine a qualsiasi istanza nella rete. Nelle versioni precedenti alla 6.2.0, se questa regola per consentire il traffico in entrata sulla porta TCP 22 non esiste nella rete utilizzata dall'istanza Cloud Data Fusion, devi crearla.
Crea un'istanza
Console
Se l'API è abilitata, la sezione Cloud Data Fusion nella Google Cloud console mostra una pagina Istanze, in cui puoi creare e gestire le istanze Cloud Data Fusion.
- Nella console, vai alla pagina Cloud Data Fusion.
- Fai clic su Istanze e poi su Crea un'istanza.
- Inserisci un nome istanza.
- Inserisci una descrizione per l'istanza.
- Specifica la regione in cui creare l'istanza.
- Specifica la versione di Cloud Data Fusion.
- Seleziona un'edizione. L'impostazione predefinita è Base.
- (Facoltativo) Fai clic su Aggiungi acceleratori per selezionare gli acceleratori da utilizzare nell'istanza.
- Specifica l'account di servizio Managed Service for Apache Spark da utilizzare per l'esecuzione della pipeline Cloud Data Fusion in Managed Service for Apache Spark. L'impostazione predefinita è l'account Compute Engine. Indipendentemente dalla versione, assicurati che un account di servizio disponga dei ruoli Identity and Access Management appropriati per le tue esigenze. Per ulteriori informazioni, consulta Concedere l'autorizzazione utente dell'account di servizio.
(Facoltativo) Specifica le opzioni avanzate. Se non specifichi nulla, vengono utilizzati i seguenti valori predefiniti:
Categoria Impostazione Descrizione Predefinito IP privato Abilita indirizzi IP interni Crea l' istanza Cloud Data Fusion con un indirizzo IP interno. Disabilitato Monitoraggio e logging avanzati Abilita Cloud Logging di Managed Service for Apache Spark
Abilita Cloud Monitoring di Managed Service for Apache Spark
Visualizza i log avanzati della pipeline in Cloud Logging. Disabilitato Integrazione della derivazione dei dati di Knowledge Catalog Abilita o disabilita l'integrazione con la derivazione dei dati di Knowledge Catalog Visualizza la derivazione in Knowledge Catalog. Disabilitato Crittografia Usa chiave di crittografia gestita dal cliente (CMEK) Utilizza il controllo dell'accesso basato sui ruoli nelle versioni 6.5 e successive. Disabilitato Etichette Una coppia chiave-valore Le etichette delle risorse per l'istanza da utilizzare per annotare le risorse sottostanti correlate, ad esempio le VM Compute Engine. Le chiavi e i valori delle etichette possono contenere solo lettere, numeri, trattini e trattini bassi. Le chiavi delle etichette devono iniziare con una lettera o un numero. Nessuno Manutenzione Abilita periodo di manutenzione Imposta la finestra di tempo in cui Cloud Data Fusion può eseguire operazioni di manutenzione sull'istanza. Per ulteriori informazioni, consulta Configurare i periodi di manutenzione. Disabilitato Fai clic su Crea. Il processo di creazione dell'istanza richiede fino a 30 minuti.
Mentre Cloud Data Fusion crea l'istanza, nella pagina Istanze viene visualizzata una rotellina di avanzamento accanto al nome dell'istanza. Al termine, si trasforma in un segno di spunta verde e indica che puoi iniziare a utilizzare l'istanza.
API
Crea un'istanza:
Per creare un'istanza Cloud Data Fusion con l'
API REST Cloud Data Fusion,
crea una richiesta API
instances.create, compilando la risorsa
Instance
con le informazioni di configurazione.
Passaggi successivi
- Scopri di più su Cloud Data Fusion.
- Segui un tutorial.