Produktionsläufe planen
In dieser Kurzanleitung werden Sie durch die folgenden Schritte zum Planen von Produktionsläufen in Dataform geführt:
- Dataform-Repository erstellen
- Erforderliche Rollen zuweisen
Releasekonfiguration und Workflowkonfiguration erstellen
Erstellen Sie eine
production-Releasekonfiguration und legen Sie die Häufigkeit fest, mit derproduction-Kompilierungsergebnisse erstellt werden. Erstellen Sie dann eineproduction-Workflowkonfiguration, wählen Sie dieproduction-Releasekonfiguration aus und legen Sie einen Zeitplan für die Ausführung vonproduction-Kompilierungsergebnissen fest.
Hinweise
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
Dataform-Administrator (
roles/dataform.admin) für Repositories -
Dataform-Bearbeiter (
roles/dataform.editor) für Arbeitsbereiche und Workflow-Aufrufe -
Dienstkontonutzer (
roles/iam.serviceAccountUser) für benutzerdefiniertes Dienstkonto -
Projekt-IAM-Administrator (
roles/resourcemanager.projectIamAdmin) für das Projekt - BigQuery-Dateneditor (
roles/bigquery.dataEditor) für Projekte, für die Dataform sowohl Lese- als auch Schreibzugriff benötigt. Das ist in der Regel das Projekt, in dem sich Ihr Dataform-Repository befindet. - BigQuery Data Viewer (
roles/bigquery.dataViewer) für Projekte, für die Dataform schreibgeschützten Zugriff benötigt. - BigQuery-Jobnutzer (
roles/bigquery.jobUser) für das Projekt, in dem sich Ihr Dataform-Repository befindet. - Ersteller von Dienstkonto-Token
(
roles/iam.serviceAccountTokenCreator) - Dienstkontonutzer
(
roles/iam.serviceAccountUser) Rufen Sie in der Google Cloud Console die Seite IAM auf.
Klicken Sie auf Zugriff erlauben.
Geben Sie im Feld Neue Hauptkonten die ID Ihres benutzerdefinierten Dienstkontos ein.
Wählen Sie im Menü Rolle auswählen die folgenden Rollen einzeln aus. Verwenden Sie für jede zusätzliche Rolle Weitere Rolle hinzufügen:
- BigQuery-Dateneditor
- BigQuery-Datenbetrachter
- BigQuery-Jobnutzer
Klicken Sie auf Speichern.
Rufen Sie in der Google Cloud Console die Seite Dienstkonten auf.
Wählen Sie Ihr benutzerdefiniertes Dienstkonto aus.
Rufen Sie Hauptkonten mit Zugriff auf und klicken Sie auf Zugriff gewähren.
Geben Sie im Feld Neue Hauptkonten die ID Ihres Dataform-Standarddienst-Agents ein.
Die ID Ihres Dataform-Standarddienst-Agents hat das folgende Format:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.comFügen Sie in der Liste Rolle auswählen die folgenden Rollen hinzu:
- Dienstkontonutzer
- Ersteller von Dienstkonto-Token
Klicken Sie auf Speichern.
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf Repository erstellen.
Führen Sie auf der Seite Repository erstellen die folgenden Schritte aus:
Geben Sie im Feld Repository-ID den Wert
quickstart-productionein.Wählen Sie in der Liste Region
europe-west4aus.Klicken Sie im Feld Dienstkonto auf Manuell eingeben und geben Sie dann den Namen Ihres benutzerdefinierten Dienstkontos ein. Geben Sie in diesem Feld Ihr benutzerdefiniertes Dienstkonto ein.
Klicken Sie auf Erstellen.
Klicken Sie auf Zu Repositories.
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-production.Klicken Sie auf Releases und Planung und dann auf Produktionsrelease erstellen.
Konfigurieren Sie im Bereich Releasekonfiguration erstellen die folgenden Einstellungen:
- Geben Sie im Feld Release-ID den Wert
productionein. - Übernehmen Sie im Feld Git commitish den Standardwert
main. - Wählen Sie im Abschnitt Häufigkeit des Zeitplans im Menü Wiederholungen die Option Benutzerdefiniert aus.
- Geben Sie im Feld Benutzerdefinierter Zeitplan
0 16 * * *ein. Wählen Sie im Menü Zeitzone eine UTC+1-Zeitzone aus, z. B. Mitteleuropäische Zeit (MEZ).
Jeden Tag um 16:00 Uhr UTC+1 kompiliert Dataform das Repository
quickstart-productionund wendet die in dieser Releasekonfiguration konfigurierten Kompilierungseinstellungen an, umproduction-Kompilierungsergebnisse zu erstellen.
- Geben Sie im Feld Release-ID den Wert
Klicken Sie auf Erstellen.
Die Releasekonfiguration
productionerstellt jeden Tag um 16:00 Uhr UTC+1 ein Kompilierungsergebnis des gesamten Repositorysquickstart-production.Achte darauf, dass du dich auf dem Tab Veröffentlichungen und Planung befindest. Rufen Sie den Bereich Workflowkonfigurationen auf und klicken Sie auf Erstellen.
Konfigurieren Sie im Bereich Workflowkonfiguration erstellen die folgenden Einstellungen:
- Geben Sie im Feld Konfigurations-ID den Wert
productionein. - Wählen Sie im Menü Releasekonfiguration die Option
productionaus. - Wählen Sie im Abschnitt Häufigkeit des Zeitplans im Menü Wiederholungen die Option Benutzerdefiniert aus.
- Geben Sie im Feld Benutzerdefinierter Zeitplan
0 17 * * *ein. Wählen Sie im Menü Zeitzone eine UTC+1-Zeitzone aus, z. B. Mitteleuropäische Zeit (MEZ).
Jeden Tag um 17:00 Uhr UTC+1 führt Dataform das letzte
production-Kompilierungsergebnis desquickstart-production-Repositorys aus.Klicken Sie auf Alle Aktionen.
Dataform führt alle Workflow-Aktionen im
production-Kompilierungsergebnis aus.
- Geben Sie im Feld Konfigurations-ID den Wert
Klicken Sie auf Erstellen.
Die Workflowkonfiguration
productionführt jeden Tag um 17:00 Uhr UTC+1 das gesamte aktuelle Kompilierungsergebnis aus, das von der Produktionsreleasekonfiguration erstellt wird.Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Wählen Sie das Repository
quickstart-productionaus.Klicke auf Veröffentlichungen und Planung.
Klicken Sie im Abschnitt Releasekonfigurationen auf
production.Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Wählen Sie das Repository
quickstart-productionaus.Klicken Sie auf Workflow-Ausführungslogs.
Wählen Sie einen Workflowlauf aus, um detailliertere Informationen zu sehen, einschließlich des Status jeder Aktion und aller Protokolle.
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und wählen Sie
dataform_productionaus.Klicken Sie auf das Menü Aktionen und wählen Sie Löschen aus.
Geben Sie im Dialogfeld Dataset löschen Löschen ein und klicken Sie auf Löschen.
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-production.Klicken Sie auf Releases und Planung und rufen Sie den Bereich Releasekonfigurationen auf.
Klicken Sie neben der
production-Releasekonfiguration auf das Menü Mehr und dann auf Löschen.Klicken Sie im Dialogfeld Releasekonfiguration löschen auf Löschen.
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-production.Klicken Sie auf Releases und Planung und rufen Sie den Bereich Workflowkonfigurationen auf.
Klicken Sie neben der Workflowkonfiguration
productionauf das Menü Mehr und dann auf Löschen.Klicken Sie im Dialogfeld Releasekonfiguration löschen auf Löschen.
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie neben
quickstart-productionauf das Menü Mehr und wählen Sie Löschen aus.Geben Sie im Fenster Repository löschen den Namen des Repositorys ein, um das Löschen zu bestätigen.
Klicken Sie zur Bestätigung auf Löschen.
- Weitere Informationen zu Dienstkonten finden Sie unter Benutzerdefinierte Dienstkonten und Dataform-Dienst-Agents.
- Weitere Informationen zum Code-Lebenszyklus in Dataform finden Sie unter Einführung in den Code-Lebenszyklus in Dataform.
- Weitere Informationen zu Best Practices für den Workflow-Lebenszyklus in Dataform finden Sie unter Best Practices für den Workflow-Lebenszyklus.
- Weitere Informationen zu Release-Konfigurationen in Dataform finden Sie unter Release-Konfiguration erstellen.
- Weitere Informationen zu Workflow-Konfigurationen in Dataform finden Sie unter Ausführungen mit Workflow-Konfigurationen planen.
Wählen Sie außerdem ein benutzerdefiniertes Dienstkonto aus oder erstellen Sie eines, um Workflows in BigQuery auszuführen.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zuzuweisen, damit Sie die nötigen Berechtigungen für alle Aufgaben in dieser Anleitung haben:
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Erforderliche Rollen zuweisen
Wenn Sie Workflows in BigQuery ausführen möchten, können Sie ein benutzerdefiniertes Dienstkonto oder Ihr Google-Konto verwenden (Vorabversion). Anmeldedaten für benutzerdefinierte Dienstkonten sind jedoch die Standardoption für geplante Ausführungen. Die Verwendung von Anmeldedaten für Google-Konten wird für geplante Ausführungen nicht empfohlen.
Damit Sie Workflows in BigQuery ausführen können, muss Ihr benutzerdefiniertes Dienstkonto die folgenden erforderlichen Rollen haben:
Damit Dataform Ihr benutzerdefiniertes Dienstkonto verwenden kann, muss der Standard-Dataform-Dienst-Agent für die benutzerdefinierte Dienstkontoressource die folgenden Rollen haben:
So weisen Sie diese Rollen zu:
Dataform-Repository erstellen
Releasekonfiguration und Workflowkonfiguration erstellen
So erstellen Sie Ergebnisse der Produktionskompilierung des Repositorys quickstart-production und planen die Ausführung von production-Tabellen:
Frühere Ergebnisse der production-Kompilierung ansehen
So rufen Sie frühere Ergebnisse der geplanten production-Kompilierung auf:
Frühere production-Workflowausführungen ansehen
So rufen Sie bisherige production-Workflow-Ausführungen auf:
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud -Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:
In BigQuery erstelltes Dataset löschen
Führen Sie die folgenden Schritte aus, um das Dataset dataform_production zu löschen und so Kosten für BigQuery-Assets zu vermeiden:
Dataform-Releasekonfiguration löschen
Für das Erstellen von Dataform-Releasekonfigurationen fallen keine Kosten an. Möchten Sie jedoch die Releasekonfiguration production löschen, gehen Sie so vor:
Dataform-Workflowkonfiguration löschen
Führen Sie die folgenden Schritte aus, um die Workflowkonfiguration der Dataform-production zu löschen und so Kosten für BigQuery-Assets zu vermeiden:
Dataform-Repository löschen
Für das Erstellen von Dataform-Repositories fallen keine Kosten an. Möchten Sie dennoch ein Repository und seinen Inhalt löschen, gehen Sie so vor: