Pianifica le esecuzioni di produzione
Questa guida rapida illustra i seguenti passaggi per pianificare le esecuzioni di produzione in Dataform:
- Crea un repository Dataform.
- Concedi i ruoli richiesti.
Crea una configurazione di release e una configurazione del workflow.
Crea una configurazione della release
productione imposta la frequenza di creazione dei risultati di compilazioneproduction. Quindi, crea unaproductionconfigurazione del workflow, seleziona laproductionconfigurazione della release e imposta una pianificazione per l'esecuzione deiproductionrisultati della compilazione.
Prima di iniziare
- Accedi al tuo account Google Cloud . Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Inoltre, seleziona o crea un service account personalizzato per eseguire i workflow in BigQuery.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per eseguire tutte le attività di questa guida rapida, chiedi all'amministratore di concederti i seguenti ruoli IAM:
-
Dataform Admin (
roles/dataform.admin) sul repository -
Service Account User (
roles/iam.serviceAccountUser) sul account di servizio personalizzato -
Project IAM Admin (
roles/resourcemanager.projectIamAdmin) sul progetto
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Concedi i ruoli richiesti
Per eseguire i flussi di lavoro in BigQuery, puoi utilizzare un service account personalizzato o il tuo Account Google (anteprima). Tuttavia, le credenziali del account di servizio personalizzato sono l'opzione predefinita per le esecuzioni pianificate. L'utilizzo delle credenziali dell'account utente dell'Account Google è sconsigliato per le esecuzioni pianificate.
Il account di servizio personalizzato deve disporre dei seguenti ruoli obbligatori:
- Editor dati BigQuery
(
roles/bigquery.dataEditor) su progetti o set di dati BigQuery specifici a cui Dataform deve accedere in lettura e scrittura. In genere, ciò include il progetto che ospita il repository Dataform. - BigQuery Data Viewer
(
roles/bigquery.dataViewer) su progetti o set di dati BigQuery specifici a cui Dataform deve accedere in sola lettura. - BigQuery Job User
(
roles/bigquery.jobUser) nel progetto che ospita il repository Dataform.
Per consentire a Dataform di utilizzare il tuo account di servizio personalizzato, l'agente di servizio Dataform predefinito deve disporre dei seguenti ruoli nella risorsa account di servizio personalizzato:
- Creatore token service account
(
roles/iam.serviceAccountTokenCreator) - Service Account User
(
roles/iam.serviceAccountUser)
Per concedere questi ruoli, segui questi passaggi:
Nella console Google Cloud vai alla pagina IAM.
Fai clic su Concedi l'accesso.
Nel campo Nuove entità, inserisci l'ID del tuo account di servizio personalizzato.
Nel menu Seleziona un ruolo, seleziona i seguenti ruoli uno alla volta utilizzando Aggiungi un altro ruolo per ogni ruolo aggiuntivo:
- Editor dati BigQuery
- Visualizzatore dati BigQuery
- Utente job BigQuery
Fai clic su Salva.
Nella Google Cloud console, vai alla pagina Service account.
Seleziona il account di servizio personalizzato.
Vai a Entità con accesso e poi fai clic su Concedi l'accesso.
Nel campo Nuove entità, inserisci l'ID service agent Dataform predefinito.
L'ID service agent Dataform predefinito ha il seguente formato:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.comSostituisci
PROJECT_NUMBERcon l'ID numerico del tuo progettoGoogle Cloud . Puoi trovare l'ID progetto Google Cloud nella dashboard della consoleGoogle Cloud . Per saperne di più, consulta la sezione Identificazione dei progetti.Nell'elenco Seleziona un ruolo, aggiungi i seguenti ruoli:
- Utente Service Account
- Creatore token service account
Fai clic su Salva.
Per saperne di più sulla concessione dei ruoli, consulta Concedere a Dataform l'accesso richiesto.
Crea un repository Dataform
Nella console Google Cloud , vai alla pagina Dataform.
Fai clic su Crea repository.
Nella pagina Crea repository:
Nel campo ID repository, inserisci
quickstart-production.Nell'elenco Regione, seleziona
europe-west4.Nell'elenco Service account, seleziona un account di servizio personalizzato per il repository.
Nella sezione Controlli delle autorizzazioni actAs, applica i controlli delle autorizzazioni alle azioni dell'utente sul repository.
Fai clic su Crea.
Fai clic su Vai ai repository.
Crea una configurazione della release e una configurazione del workflow
Per creare i risultati della compilazione di produzione del repository quickstart-production
e pianificare l'esecuzione delle tabelle production:
Nella console Google Cloud , vai alla pagina Dataform.
Fai clic su
quickstart-production.Fai clic su Release e programmazione, quindi su Crea release di produzione.
Nel riquadro Crea configurazione della release, configura le seguenti impostazioni:
- Nel campo ID release, inserisci
production. - Nel campo Commitish Git, lascia il valore predefinito
main. - Nella sezione Frequenza di pianificazione, seleziona Personalizzata nel menu Ripetizioni.
- Nel campo Pianificazione personalizzata, inserisci
0 16 * * *. Nel menu Fuso orario, seleziona un fuso orario UTC+1, ad esempio Ora solare dell'Europa centrale (CET).
Ogni giorno alle 16:00 UTC+1, Dataform compila il repository
quickstart-productione applica le impostazioni di compilazione configurate in questa configurazione della release per creare i risultati di compilazioneproduction.
- Nel campo ID release, inserisci
Fai clic su Crea.
La configurazione della release
productioncrea un risultato di compilazione dell'intero repositoryquickstart-productionogni giorno alle 16:00 UTC+1.Assicurati di trovarti nella scheda Uscite e programmazione. Vai alla sezione Configurazioni dei flussi di lavoro e fai clic su Crea.
Nel riquadro Crea configurazione del flusso di lavoro, configura le seguenti impostazioni:
- Nel campo ID configurazione, inserisci
production. - Nel menu Configurazione della release, seleziona
production. - Nella sezione Frequenza di pianificazione, seleziona Personalizzata nel menu Ripetizioni.
- Nel campo Pianificazione personalizzata, inserisci
0 17 * * *. Nel menu Fuso orario, seleziona un fuso orario UTC+1, ad esempio Ora solare dell'Europa centrale (CET).
Ogni giorno alle 17:00 UTC+1, Dataform esegue l'ultimo risultato di compilazione
productiondel repositoryquickstart-production.Fai clic su Tutte le azioni.
Dataform esegue tutte le azioni del flusso di lavoro nel risultato della compilazione
production.
- Nel campo ID configurazione, inserisci
Fai clic su Crea.
La configurazione del flusso di lavoro
productionesegue l'intero risultato della compilazione più recente creato dalla configurazione della release di produzione ogni giorno alle 17:00 UTC+1.
Visualizzare i risultati di compilazione precedenti di production
Per visualizzare i risultati delle compilazioni di production pianificate precedenti:
Nella console Google Cloud , vai alla pagina Dataform.
Seleziona il repository
quickstart-production.Fai clic su Uscite e programmazione.
Nella sezione Configurazioni della release, fai clic su
production.
Visualizza le esecuzioni del flusso di lavoro degli ultimi production giorni
Per visualizzare le esecuzioni precedenti del flusso di lavoro production:
Nella console Google Cloud , vai alla pagina Dataform.
Seleziona il repository
quickstart-production.Fai clic su Log di esecuzione del flusso di lavoro.
Seleziona un'esecuzione del flusso di lavoro per visualizzare informazioni più dettagliate, incluso lo stato di ogni azione e tutti i log.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
Elimina il set di dati creato in BigQuery
Per evitare che ti vengano addebitati costi per gli asset BigQuery, segui questi passaggi per eliminare il set di dati denominato dataform_production:
Nella console Google Cloud , vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e seleziona
dataform_production.Fai clic sul menu Azioni e seleziona Elimina.
Nella finestra di dialogo Elimina set di dati, inserisci delete e fai clic su Elimina.
Elimina la configurazione della release Dataform
Non sono previsti costi per la creazione di configurazioni delle release Dataform. Tuttavia, se vuoi eliminare la configurazione della release production:
Nella console Google Cloud , vai alla pagina Dataform.
Fai clic su
quickstart-production.Fai clic su Release e pianificazione e vai alla sezione Configurazioni della release.
Accanto alla configurazione della release
production, fai clic sul menu Altro e poi su Elimina.Nella finestra di dialogo Elimina configurazione della release, fai clic su Elimina.
Elimina la configurazione del flusso di lavoro Dataform
Per evitare che ti vengano addebitati costi per gli asset BigQuery, segui questi
passaggi per eliminare la configurazione del flusso di lavoro production di Dataform:
Nella console Google Cloud , vai alla pagina Dataform.
Fai clic su
quickstart-production.Fai clic su Release e pianificazione e vai alla sezione Configurazioni del flusso di lavoro.
Accanto alla configurazione del flusso di lavoro
production, fai clic sul menu Altro e poi su Elimina.Nella finestra di dialogo Elimina configurazione della release, fai clic su Elimina.
Elimina il repository Dataform
Non sono previsti costi per la creazione di repository di Dataform. Tuttavia, se vuoi eliminare un repository e tutti i relativi contenuti, segui questi passaggi:
Nella console Google Cloud , vai alla pagina Dataform.
Accanto a
quickstart-production, fai clic sul menu Altro e seleziona Elimina.Nella finestra Elimina repository, inserisci il nome del repository per confermare l'eliminazione.
Per confermare, fai clic su Elimina.
Passaggi successivi
- Per saperne di più sui service account, consulta Informazioni sui service account personalizzati e sugli agenti di servizio Dataform.
- Per scoprire di più sul ciclo di vita del codice in Dataform, consulta Introduzione al ciclo di vita del codice in Dataform.
- Per scoprire di più sulle best practice per il ciclo di vita del workflow in Dataform, consulta Best practice per il ciclo di vita del workflow.
- Per scoprire di più sulle configurazioni di rilascio in Dataform, consulta Creare una configurazione di rilascio.
- Per scoprire di più sulle configurazioni dei workflow in Dataform, vedi Pianificare le esecuzioni con le configurazioni dei workflow.