Entwicklungsumgebungen erstellen
In dieser Kurzanleitung werden Sie durch die Schritte zum Erstellen einzelner Entwicklungsumgebungen in Dataform geführt, damit jeder Entwickler in seiner eigenen Entwicklungsumgebung arbeiten kann:
- Dataform-Repository erstellen.
- Erforderliche Rollen zuweisen.
Überschreibungen von Arbeitsbereichskompilierungen konfigurieren.
Konfigurieren Sie Kompilierungsüberschreibungen, die Dataform auf alle Arbeitsbereiche in Ihrem Repository anwendet und Arbeitsbereiche in isolierte Entwicklungsumgebungen umwandelt.
Hinweis
- Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistung unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Wenn Sie außerdem ein benutzerdefiniertes Dienstkonto zum Ausführen von Workflows in BigQuery verwenden möchten, wählen Sie ein benutzerdefiniertes Dienstkonto aus oder erstellen Sie eines.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Ausführen aller Aufgaben in dieser Kurzanleitung benötigen:
-
Dataform-Administrator (
roles/dataform.admin) für das Repository -
Dienstkontonutzer (
roles/iam.serviceAccountUser) für das benutzerdefinierte Dienstkonto -
Projekt-IAM-Administrator (
roles/resourcemanager.projectIamAdmin) für das Projekt
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Erforderliche Rollen zuweisen
Zum Ausführen von Workflows in BigQuery können Sie ein benutzerdefiniertes Dienstkonto oder Ihr Google-Konto verwenden.
Ihr benutzerdefiniertes Dienstkonto muss die folgenden erforderlichen Rollen haben:
- BigQuery-Dateneditor
(
roles/bigquery.dataEditor) für Projekte oder bestimmte BigQuery-Datasets, für die Dataform Lese- und Schreibzugriff benötigt. Dazu gehört in der Regel das Projekt, in dem sich Ihr Dataform-Repository befindet. - BigQuery-Datenbetrachter
(
roles/bigquery.dataViewer) für Projekte oder bestimmte BigQuery-Datasets, für die Dataform nur Lesezugriff benötigt. - BigQuery-Jobnutzer
(
roles/bigquery.jobUser) für das Projekt, in dem sich Ihr Dataform-Repository befindet.
Damit Dataform Ihr benutzerdefiniertes Dienstkonto verwenden kann, muss der standardmäßige Dataform-Dienst-Agent die folgenden Rollen für die benutzerdefinierte Dienstkontoressource haben:
- Ersteller von Dienstkonto-Token
(
roles/iam.serviceAccountTokenCreator) - Dienstkontonutzer
(
roles/iam.serviceAccountUser)
So weisen Sie diese Rollen zu:
Rufen Sie in der Google Cloud Console die Seite IAM auf.
Klicken Sie auf Zugriff erlauben.
Geben Sie im Feld Neue Hauptkonten die ID Ihres benutzerdefinierten Dienstkontos ein.
Wählen Sie im Menü Rolle auswählen die folgenden Rollen einzeln aus. Verwenden Sie für jede zusätzliche Rolle Weitere Rolle hinzufügen:
- BigQuery-Dateneditor
- BigQuery-Datenbetrachter
- BigQuery-Jobnutzer
Klicken Sie auf Speichern.
Rufen Sie in der Google Cloud Console die Seite Dienstkonten auf.
Wählen Sie Ihr benutzerdefiniertes Dienstkonto aus.
Rufen Sie Hauptkonten mit Zugriff auf und klicken Sie dann auf Zugriff erlauben.
Geben Sie im Feld Neue Hauptkonten die ID Ihres standardmäßigen Dataform-Dienst-Agents ein.
Die ID Ihres standardmäßigen Dataform-Dienst-Agents hat das folgende Format:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.comErsetzen Sie
PROJECT_NUMBERdurch die numerische ID Ihres Google Cloud Projekts. Sie finden Ihre Google Cloud Projekt-ID im Google Cloud Console-Dashboard. Weitere Informationen finden Sie unter Projekte identifizieren.Fügen Sie in der Liste Rolle auswählen die folgenden Rollen hinzu:
- Dienstkontonutzer
- Ersteller von Dienstkonto-Token
Klicken Sie auf Speichern.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Dataform den erforderlichen Zugriff gewähren.
Dataform-Repository erstellen
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf Repository erstellen.
Führen Sie auf der Seite Repository erstellen die folgenden Schritte aus:
Geben Sie im Feld Repository-ID den Wert
quickstart-devein.Wählen Sie in der Liste Region die Option
europe-west4aus.Wählen Sie in der Liste Dienstkonto ein benutzerdefiniertes Dienstkonto für das Repository aus.
Erzwingen Sie im Abschnitt Prüfungen auf Berechtigung „actAs“ die Berechtigungsprüfungen für Nutzeraktionen im Repository.
Klicken Sie auf Erstellen.
Klicken Sie auf Zu Repositories.
Überschreibungen von Arbeitsbereichskompilierungen konfigurieren
So erstellen Sie isolierte Entwicklungsumgebungen mit Überschreibungen von Dataform-Arbeitsbereichskompilierungen:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-dev.Klicken Sie auf Einstellungen und dann auf Bearbeiten
Geben Sie im Bereich Überschreibungen von Arbeitsbereichskompilierungen im Feld Schema-Suffix den Wert
${workspaceName}ein.Wenn Sie eine Ausführung in einem Arbeitsbereich auslösen, hängt Dataform den Namen des Arbeitsbereichs als Suffix an das in den Workfloweinstellungenfestgelegte Standardschema an. In dieser Kurzanleitung werden die Dataform-Standardeinstellungen mit dem Standardschema
dataformverwendet.Klicken Sie auf Speichern.
Dataform wendet Überschreibungen von Arbeitsbereichskompilierungen auf alle Arbeitsbereiche in Ihrem Repository an.
Wenn Sie mit dieser Konfiguration einen Workflow manuell in einem Arbeitsbereich ausführen, führt Dataform ihn mit Überschreibungen von Arbeitsbereichskompilierungen aus.
Dataform führt den Workflow also im Schema dataform_workspaceName in BigQuery aus und wandelt den
Arbeitsbereich in eine isolierte Entwicklungsumgebung um.
Wenn Sie beispielsweise eine Ausführung manuell in einem sasha-Arbeitsbereich auslösen,
führt Dataform Ihren Workflow im Schema dataform_sasha in
BigQuery aus.
Wenn Sie Workflows ohne Überschreibungen von Arbeitsbereichskompilierungen ausführen, aber die Überschreibungen von Arbeitsbereichskompilierungen für Entwicklungsumgebungen beibehalten möchten, können Sie Releasekonfigurationen erstellen, um andere Ausführungsumgebungen zu konfigurieren, z. B. staging und production.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud -Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden.
In BigQuery erstellte Datasets löschen
Löschen Sie Datasets
mit Namen, die mit dataform beginnen, z. B. dataform-sasha, damit keine Gebühren für BigQuery-Assets anfallen.
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und wählen Sie ein Dataset aus.
Klicken Sie auf das Menü „ Aktionen“ und wählen Sie Löschen aus.
Geben Sie im Dialogfeld Dataset löschen den Wert
deletein das Feld ein und klicken Sie auf Löschen.
Dataform-Repository löschen
Für das Erstellen von Dataform-Repositories fallen keine Kosten an. Möchten Sie dennoch ein Repository und seinen Inhalt löschen, gehen Sie so vor:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie neben
quickstart-devauf das Menü Mehr und wählen Sie Löschen aus.- Geben Sie im Fenster Repository löschen den Namen des Repositorys ein, um das Löschen zu bestätigen.
Klicken Sie zur Bestätigung auf Löschen.
Nächste Schritte
- Weitere Informationen zu Dienstkonten finden Sie unter Benutzerdefinierte Dienstkonten und Dataform-Dienst-Agents.
- Weitere Informationen zum Codelebenszyklus in Dataform finden Sie unter Einführung in den Codelebenszyklus in Dataform.
- Weitere Informationen zu Best Practices für den Workflowlebenszyklus in Dataform finden Sie unter Best Practices für den Workflowlebenszyklus.
- Weitere Informationen zu Überschreibungen von Arbeitsbereichskompilierungen in Dataform finden Sie unter Überschreibungen von Arbeitsbereichskompilierungen erstellen.
- Informationen zum Planen von Produktionsausführungen in Dataform finden Sie unter Produktionsausführungen planen.