Entwicklungsumgebungen erstellen

In dieser Kurzanleitung werden Sie durch die Schritte zum Erstellen individueller Entwicklungsumgebungen in Dataform geführt, damit jeder Entwickler in seiner eigenen Entwicklungsumgebung arbeiten kann:

Hinweise

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery and Dataform APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery and Dataform APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  8. Wenn Sie außerdem ein benutzerdefiniertes Dienstkonto zum Ausführen von Workflows in BigQuery verwenden möchten, wählen Sie ein benutzerdefiniertes Dienstkonto aus oder erstellen Sie eines.

    Erforderliche Rollen

    Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zuzuweisen, damit Sie die nötigen Berechtigungen für alle Aufgaben in dieser Anleitung haben:

    Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

    Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

    Erforderliche Rollen zuweisen

    Wenn Sie Workflows in BigQuery ausführen möchten, können Sie ein benutzerdefiniertes Dienstkonto oder Ihr Google-Konto verwenden (Vorabversion). In den folgenden Abschnitten werden die erforderlichen Rollen für Ihr benutzerdefiniertes Dienstkonto oder Ihr Google-Konto und für den Dataform-Standarddienst-Agent beschrieben.

    Benutzerdefiniertem Dienstkonto oder Google-Konto Rollen zuweisen

    Damit Sie Workflows in BigQuery ausführen können, muss Ihr benutzerdefiniertes Dienstkonto oder Ihr Google-Konto (Vorschau) die folgenden erforderlichen Rollen haben:

    • BigQuery-Dateneditor (roles/bigquery.dataEditor) für Projekte, für die Dataform sowohl Lese- als auch Schreibzugriff benötigt. Das ist in der Regel das Projekt, in dem sich Ihr Dataform-Repository befindet.
    • BigQuery Data Viewer (roles/bigquery.dataViewer) für Projekte, für die Dataform schreibgeschützten Zugriff benötigt.
    • BigQuery-Jobnutzer (roles/bigquery.jobUser) für das Projekt, in dem sich Ihr Dataform-Repository befindet.

    So weisen Sie Ihrem benutzerdefinierten Dienstkonto oder Google-Konto (Vorschau) BigQuery-Rollen zu:

    1. Rufen Sie in der Google Cloud Console die Seite IAM auf.

      IAM aufrufen

    2. Klicken Sie auf Zugriff erlauben.

    3. Geben Sie im Feld Neue Hauptkonten die ID Ihres benutzerdefinierten Dienstkontos oder die E-Mail-Adresse Ihres Google-Kontos ein (Vorschau).

    4. Wählen Sie im Menü Rolle auswählen die folgenden Rollen einzeln aus. Verwenden Sie für jede zusätzliche Rolle Weitere Rolle hinzufügen:

      • BigQuery-Dateneditor
      • BigQuery-Datenbetrachter
      • BigQuery-Jobnutzer
    5. Klicken Sie auf Speichern.

    Dem Dataform-Standarddienst-Agent Rollen zuweisen

    Wenn Sie ein benutzerdefiniertes Dienstkonto zum Ausführen von Workflows in BigQuery verwenden, müssen Sie Dataform erlauben, Ihr benutzerdefiniertes Dienstkonto zu verwenden. So weisen Sie dem standardmäßigen Dataform-Dienst-Agent die Rolle Ersteller von Dienstkonto-Tokens (roles/iam.serviceAccountTokenCreator) für die benutzerdefinierte Dienstkontoressource zu:

    1. Rufen Sie in der Google Cloud Console die Seite IAM > Dienstkonten auf.

      Zur Seite „Dienstkonten“

    2. Wählen Sie Ihr benutzerdefiniertes Dienstkonto aus.

    3. Rufen Sie Hauptkonten mit Zugriff auf und klicken Sie auf Zugriff gewähren.

    4. Geben Sie im Feld Neue Hauptkonten die ID Ihres Dataform-Standarddienst-Agents ein.

      Die ID Ihres Dataform-Standarddienst-Agents hat das folgende Format:

      service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
      

      Ersetzen Sie PROJECT_NUMBER durch dieGoogle Cloud Projektnummer.

    5. Fügen Sie in der Liste Rolle auswählen die Rolle Ersteller von Dienstkonto-Tokens hinzu.

    6. Klicken Sie auf Speichern.

    Dataform-Repository erstellen

    1. Rufen Sie in der Google Cloud Console die Seite Dataform auf.

      Zu Dataform

    2. Klicken Sie auf Repository erstellen.

    3. Führen Sie auf der Seite Repository erstellen die folgenden Schritte aus:

      1. Geben Sie im Feld Repository-ID den Wert quickstart-dev ein.

      2. Wählen Sie in der Liste Region europe-west4 aus.

      3. Klicken Sie auf Erstellen.

    4. Klicken Sie auf Zu Repositories.

    Kompilierungsüberschreibungen für Arbeitsbereiche konfigurieren

    So erstellen Sie isolierte Entwicklungsumgebungen mit Überschreibungen von Dataform-Arbeitsbereichskompilierungen:

    1. Rufen Sie in der Google Cloud Console die Seite Dataform auf.

      Zu Dataform

    2. Klicken Sie auf quickstart-dev.

    3. Klicken Sie auf Einstellungen und dann auf Bearbeiten

    4. Geben Sie im Bereich Überschreibungen von Arbeitsbereichskompilierungen im Feld Schema-Suffix den Wert ${workspaceName} ein.

      Wenn Sie einen Lauf in einem Arbeitsbereich auslösen, hängt Dataform den Namen des Arbeitsbereichs als Suffix an das in den Workflow-Einstellungen festgelegte Standardschema an. In dieser Kurzanleitung werden die Dataform-Standardeinstellungen mit dem Standardschema dataform verwendet.

    5. Klicken Sie auf Speichern.

    Dataform wendet Überschreibungen von Arbeitsbereichskompilierungen auf alle Arbeitsbereiche in Ihrem Repository an.

    Wenn Sie einen Workflow in einem Arbeitsbereich manuell ausführen, wird er mit Überschreibungen von Arbeitsbereichskompilierungen ausgeführt. Dataform führt den Workflow also im dataform_workspaceName-Schema in BigQuery aus und wandelt den Arbeitsbereich in eine isolierte Entwicklungsumgebung um.

    Wenn Sie beispielsweise die Ausführung in einem sasha-Arbeitsbereich manuell auslösen, führt Dataform Ihren Workflow im Schema dataform_sasha in BigQuery aus.

    Wenn Sie Workflows ohne Überschreibungen von Arbeitsbereichskompilierungen ausführen, aber die Überschreibungen von Arbeitsbereichskompilierungen für Entwicklungsumgebungen beibehalten möchten, können Sie Releasekonfigurationen erstellen, um andere Ausführungsumgebungen zu konfigurieren, z. B. staging und production.

    Bereinigen

    Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud -Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:

    In BigQuery erstellte Datasets löschen

    Löschen Sie Datasets mit Namen, die mit dataform beginnen, z. B. dataform-sasha, damit keine Gebühren für BigQuery-Assets anfallen.

    1. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

      BigQuery aufrufen

    2. Maximieren Sie im Bereich Explorer Ihr Projekt und wählen Sie ein Dataset aus.

    3. Klicken Sie auf das Menü  Aktionen und wählen Sie Löschen aus.

    4. Geben Sie im Dialogfeld Dataset löschen den Wert delete in das Feld ein und klicken Sie auf Löschen.

    Dataform-Repository löschen

    Für das Erstellen von Dataform-Repositories fallen keine Kosten an. Möchten Sie dennoch ein Repository und seinen Inhalt löschen, gehen Sie so vor:

    1. Rufen Sie in der Google Cloud Console die Seite Dataform auf.

      Zu Dataform

    2. Klicken Sie neben quickstart-dev auf das Menü  Mehr und wählen Sie Löschen aus.

      1. Geben Sie im Fenster Repository löschen den Namen des Repositorys ein, um das Löschen zu bestätigen.
    3. Klicken Sie zur Bestätigung auf Löschen.

    Nächste Schritte