Git-Repository verbinden und Workflow ausführen
In dieser Kurzanleitung wird beschrieben, wie Sie ein Dataform-Repository erstellen, es mit einem vorhandenen Drittanbieter-Git-Repository verbinden und einen Workflow ausführen. Die folgenden Aufgaben werden über dieGoogle Cloud Console und die Dataform API ausgeführt:
- Dataform-Repository erstellen
- Verbinden Sie das Repository mit dem GitHub-Repository
dataform-co/dataform-example-project-bigquery. - Entwicklungsarbeitsbereich erstellen und initialisieren
- Fügen Sie dem Projekt eine neue Ansicht hinzu.
- Kompilieren Sie das Projekt und führen Sie den Workflow in BigQuery aus.
Hinweis
- Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, Dataform, and Secret Manager APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, Dataform, and Secret Manager APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Ausführen aller Aufgaben in dieser Kurzanleitung benötigen:
- Dataform-Administrator (
roles/dataform.admin) für das Projekt oder Repository - BigQuery Data Editor (
roles/bigquery.dataEditor) für das Projekt oder bestimmte Datasets - BigQuery-Jobnutzer (
roles/bigquery.jobUser) für das Projekt - Dienstkontonutzer (
roles/iam.serviceAccountUser) für das benutzerdefinierte Dienstkonto
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Dataform-Repository erstellen
Ein Repository ist der Hauptcontainer für Ihr Dataform-Projekt. Wählen Sie eine der folgenden Optionen aus:
Console
Rufen Sie die BigQuery-Seite Dataform auf.
Klicken Sie auf Repository erstellen.
Führen Sie auf der Seite Repository erstellen die folgenden Schritte aus:
- Geben Sie im Feld Repository-ID den Wert
quickstart-repoein. - Wählen Sie in der Liste Region eine Region aus, z. B.
europe-west4. - Wählen Sie in der Liste Dienstkonto ein benutzerdefiniertes Dienstkonto für das Repository aus.
- Klicken Sie auf Erstellen.
- Klicken Sie auf Zu Repositories.
- Geben Sie im Feld Repository-ID den Wert
Sie haben ein Dataform-Repository erstellt. Als Nächstes können Sie das Dataform-Repository mit einem Remote-Git-Repository verbinden.
API
Verwenden Sie zum Erstellen eines Repositorys die Methode projects.locations.repositories.create.
Führen Sie die API-Anfrage mit den folgenden Informationen aus:
- Endpunkt:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories - Abfrageparameter:
repositoryId=REPOSITORY_ID
Alternativ können Sie im Terminal den folgenden curl-Befehl ausführen:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d '{"serviceAccount": "SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com"}' \
"https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories?repositoryId=REPOSITORY_ID"
Ersetzen Sie Folgendes:
SERVICE_ACCOUNT_NAME: die ID des benutzerdefinierten Dienstkontos, das zum Ausführen von BigQuery-Jobs erstellt wurde.PROJECT_ID: Die eindeutige Kennung desGoogle Cloud -Projekts, in dem Sie das Dataform-Repository erstellen möchten.LOCATION: die Google Cloud -Region, in der Sie das Repository erstellen möchten, z. B.europe-west4.REPOSITORY_ID: Die eindeutige Kennung für Ihr neues Dataform-Repository, z. B.quickstart-repo.
Sie haben ein Dataform-Repository erstellt. Als Nächstes können Sie das Dataform-Repository mit einem Remote-Git-Repository verbinden.
Mit dem Git-Repository verbinden
Wählen Sie eine der folgenden Optionen aus, um Ihr Dataform-Repository mit Ihrem Projekt zu verbinden:
Console
Rufen Sie die Seite Secret Manager auf.
Klicken Sie auf Secret erstellen.
Geben Sie im Feld Name
dataform-git-tokenein.Geben Sie im Feld Secret-Wert Ihr persönliches GitHub-Zugriffstoken (Personal Access Token, PAT) ein.
Eine Anleitung zum Erstellen eines PAT finden Sie unter Persönliche Zugriffstokens verwalten.
Wir empfehlen, ein Ablaufdatum für Ihr Token gemäß den Sicherheitsrichtlinien Ihrer Organisation festzulegen.
Klicken Sie auf Secret erstellen.
Klicken Sie auf der Secret-Detailseite auf den Tab Berechtigungen und dann auf Zugriff gewähren.
Geben Sie im Feld Neue Hauptkonten Ihren Dataform-Dienst-Agent ein:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com.Ersetzen Sie
PROJECT_NUMBERdurch dieGoogle Cloud Projektnummer. Weitere Informationen zum Ermitteln der Projektnummer finden Sie unter Projektname, -nummer und -ID ermitteln.Wählen Sie im Feld Rolle auswählen die Option Secret Manager > Zugriffsperson für Secret Manager-Secret aus.
Klicken Sie auf Speichern.
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-repo.Klicken Sie auf der Repository-Seite auf Einstellungen> Mit Git verbinden.
Wählen Sie im Bereich Link zum Remote-Repository die Option HTTPS aus.
Geben Sie im Feld URL des Remote-Git-Repositorys den Wert
https://github.com/dataform-co/dataform-example-project-bigquery.gitein.Geben Sie im Feld Default remote branch name den Wert
masterein.Wählen Sie im Menü Secret die Option
dataform-git-tokenaus.Klicken Sie auf Verknüpfen.
Sie haben Ihr Dataform-Repository erfolgreich mit einem Remote-Git-Repository verbunden und die erforderlichen Berechtigungen erteilt. Als Nächstes können Sie einen Entwicklungsarbeitsbereich erstellen und initialisieren.
API
Wenn Sie Ihr persönliches Git-Zugriffstoken speichern möchten, erstellen Sie im Secret Manager ein Secret mit der
projects.secrets.create-Methode. Führen Sie die API-Anfrage mit den folgenden Informationen aus:- Endpunkt:
POST https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets - Abfrageparameter:
secretId=dataform-git-token Body:
{ "replication": { "automatic": {} } }
Alternativ können Sie im Terminal den folgenden
curl-Befehl ausführen:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "replication": { "automatic": {} } }' \ "https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets?secretId=dataform-git-token"- Endpunkt:
Fügen Sie dem Secret mit Ihrem persönlichen GitHub-Zugriffstoken (Personal Access Token, PAT) eine Version hinzu. Eine Anleitung zum Erstellen eines PAT finden Sie unter Persönliche Zugriffstokens verwalten. Wir empfehlen, gemäß den Sicherheitsrichtlinien Ihrer Organisation ein Ablaufdatum für Ihr Token festzulegen.
Verwenden Sie die Methode
projects.secrets.addVersion, um eine Secret-Version hinzuzufügen. Führen Sie die API-Anfrage mit den folgenden Informationen aus:- Endpunkt:
POST https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/dataform-git-token:addVersion Body:
{ "payload": { "data": "GITHUB_PAT" } }
Alternativ können Sie im Terminal den folgenden
curl-Befehl ausführen:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "payload": { "data": "$(echo -n "GITHUB_PAT" | base64)" } }' \ "https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/dataform-git-token:addVersion"Ersetzen Sie
GITHUB_PATdurch Ihr persönliches GitHub-Zugriffstoken. Der Befehlcurlkonvertiert Ihr PAT automatisch in einen Base64-codierten String, bevor die Anfrage gesendet wird.- Endpunkt:
Damit Dataform auf das Secret zugreifen kann, weisen Sie dem Dataform-Dienst-Agenten die Rolle „Zugriffsperson für Secret Manager-Secret“ (
roles/secretmanager.secretAccessor) zu. Wählen Sie eine der folgenden Optionen aus, um die Rolle zuzuweisen:gcloud
Führen Sie den Befehl
gcloud secrets add-iam-policy-bindingaus:gcloud secrets add-iam-policy-binding dataform-git-token \ --member="serviceAccount:service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com" \ --role="roles/secretmanager.secretAccessor"Ersetzen Sie
PROJECT_NUMBERdurch dieGoogle Cloud Projektnummer. Weitere Informationen zum Ermitteln der Projektnummer finden Sie unter Projektname, -nummer und -ID ermitteln.Secret Manager API
Verwenden Sie die Methode
projects.secrets.setIamPolicy: Führen Sie die API-Anfrage mit den folgenden Informationen aus:- Endpunkt:
POST https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/dataform-git-token:setIamPolicy Body:
{ "policy": { "bindings": [ { "role": "roles/secretmanager.secretAccessor", "members": [ "serviceAccount:service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com" ] } ] } }
Alternativ können Sie im Terminal den folgenden
curl-Befehl ausführen:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "policy": { "bindings": [ { "role": "roles/secretmanager.secretAccessor", "members": [ "serviceAccount:service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com" ] } ] } }' \ "https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/dataform-git-token:setIamPolicy"Ersetzen Sie
PROJECT_NUMBERdurch dieGoogle Cloud Projektnummer. Weitere Informationen zum Ermitteln der Projektnummer finden Sie unter Projektname, -nummer und -ID ermitteln.- Endpunkt:
Verwenden Sie die Methode
projects.locations.repositories.patch, um Ihr Repository mit einem Remote-Git-Repository zu verbinden. Führen Sie die API-Anfrage mit den folgenden Informationen aus:- Endpunkt:
PATCH https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID - Abfrageparameter:
updateMask=gitRemoteSettings
Alternativ können Sie im Terminal den folgenden
curl-Befehl ausführen:curl -X PATCH \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "gitRemoteSettings": { "url": "https://github.com/dataform-co/dataform-example-project-bigquery.git", "defaultBranch": "master", "authenticationTokenSecretVersion": "projects/PROJECT_ID/secrets/dataform-git-token/versions/1" } }' \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID?updateMask=gitRemoteSettings"- Endpunkt:
Sie haben Ihr Dataform-Repository erfolgreich mit einem Remote-Git-Repository verbunden und die erforderlichen Berechtigungen erteilt. Als Nächstes können Sie einen Entwicklungsarbeitsbereich erstellen und initialisieren.
Entwicklungsarbeitsbereich erstellen und initialisieren
Ein Arbeitsbereich ist eine isolierte Entwicklungsumgebung. Wählen Sie eine der folgenden Optionen aus, um einen Arbeitsbereich zu erstellen und zu initialisieren:
Console
Rufen Sie die BigQuery-Seite Dataform auf.
Klicken Sie auf
quickstart-repo.Rufen Sie in Ihrem Repository den Tab Development Workspaces (Entwicklungsarbeitsbereiche) auf.
Klicken Sie auf Entwicklungsarbeitsbereich erstellen.
Geben Sie im Feld Workspace-ID den Wert
dev-workspaceein.Klicken Sie auf Erstellen.
Wählen Sie auf dem Tab Entwicklungsarbeitsbereiche den Arbeitsbereich
dev-workspaceaus.
Sie haben einen Entwicklungsarbeitsbereich erstellt und initialisiert. Als Nächstes können Sie die Workfloweinstellungen konfigurieren.
API
Verwenden Sie zum Erstellen eines Arbeitsbereichs die Methode projects.locations.repositories.workspaces.create.
Führen Sie die API-Anfrage mit den folgenden Informationen aus:
- Endpunkt:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces - Abfrageparameter:
workspaceId=WORKSPACE_ID
Alternativ können Sie im Terminal den folgenden curl-Befehl ausführen:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{}" \
"https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces?workspaceId=WORKSPACE_ID"
Ersetzen Sie WORKSPACE_ID durch die eindeutige Kennung für Ihren neuen Dataform-Entwicklungsarbeitsbereich, z. B. dev-workspace.
Sie haben einen Entwicklungsarbeitsbereich erstellt und initialisiert. Als Nächstes können Sie die Workfloweinstellungen konfigurieren.
Workflows konfigurieren
In diesem Abschnitt aktualisieren Sie die Projekt-ID in der Datei workflow_settings.yaml, damit Dataform den Workflow in IhremGoogle Cloud -Projekt ausführt. Wählen Sie eine der folgenden Optionen aus, um die Workfloweinstellungen zu konfigurieren:
Console
Rufen Sie die BigQuery-Seite Dataform auf.
Klicken Sie auf
quickstart-repo.Rufen Sie in Ihrem Repository den Tab Entwicklungsarbeitsbereiche auf und klicken Sie dann auf
dev-workspace.Wählen Sie im Bereich Dateien die Option
workflow_settings.yamlaus.Ersetzen Sie in der Datei den Wert von
defaultProjectdurch Ihre Projekt-ID.Die Datei wird automatisch gespeichert.
Sie haben Ihre Workflow-Einstellungen aktualisiert. Als Nächstes können Sie Ihrem Projekt eine neue Quellendeklaration hinzufügen.
API
Erstellen Sie eine lokale Datei mit dem Namen
workflow_settings.yamlund fügen Sie die folgende Konfiguration in die Datei ein:defaultProject: PROJECT_ID defaultDataset: dataform dataformCoreVersion: CORE_VERSIONErsetzen Sie
CORE_VERSIONdurch die aktuelle stabile (nicht Beta-)Version von Dataform Core, z. B.3.0.43. Die aktuelle Version finden Sie unter Releases.Codieren Sie den Dateiinhalt im Terminal in einen Base64-String:
base64 -w 0 workflow_settings.yamlKopieren Sie den resultierenden Ausgabestring, um ihn im Platzhalter
SETTINGS_DEFINITIONzu verwenden, falls Sie sich später in diesen Schritten für die Verwendung des alternativen Befehlscurlentscheiden.Verwenden Sie die Methode
projects.locations.repositories.workspaces.writeFile, um die Workflow-Einstellungen zu aktualisieren. Führen Sie die API-Anfrage mit den folgenden Informationen aus:- Endpunkt:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile
Alternativ können Sie im Terminal den folgenden
curl-Befehl ausführen:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "path": "workflow_settings.yaml", "contents": "SETTINGS_DEFINITION" }' \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile"Ersetzen Sie
SETTINGS_DEFINITIONdurch den Inhalt der YAML-Datei als Base64-codierten String.- Endpunkt:
Sie haben Ihre Workflow-Einstellungen aktualisiert. Als Nächstes können Sie Ihrem Projekt eine neue Quellendeklaration hinzufügen.
Quelle erstellen
In diesem Abschnitt fügen Sie Ihrem Projekt eine neue SQLX-Quelldeklaration hinzu, die ein vorhandenes BigQuery-Dataset definiert, damit Dataform es in Ihrem Workflow als Datenquelle referenzieren kann. Wählen Sie eine der folgenden Optionen aus, um die neue Quelle zu erstellen:
Console
Rufen Sie die BigQuery-Seite Dataform auf.
Klicken Sie auf
quickstart-repo.Rufen Sie in Ihrem Repository den Tab Entwicklungsarbeitsbereiche auf und klicken Sie dann auf
dev-workspace.Wählen Sie im Bereich Dateien den Ordner
definitionsaus.Klicken Sie auf Weitere Dateiaktionen > Datei erstellen.
Geben Sie im Feld Dateipfad hinzufügen
definitions/sources/tags.sqlxein.Klicken Sie auf Datei erstellen.
Fügen Sie im SQL-Editor für die neue Datei
definitions/sources/tags.sqlxden folgenden Code ein:config { type: "declaration", database: "bigquery-public-data", schema: "stackoverflow", name: "tags" }
Sie haben eine Quellendeklaration erstellt. Als Nächstes können Sie Ihrem Projekt eine neue Ansicht hinzufügen.
API
- Erstellen Sie eine lokale Datei mit dem Namen
tags.sqlx. Fügen Sie den folgenden Code in die
tags.sqlx-Datei ein:config { type: "declaration", database: "bigquery-public-data", schema: "stackoverflow", name: "tags" }Codieren Sie im Terminal den Dateiinhalt in einen einzelnen fortlaufenden String:
base64 -w 0 tags.sqlxKopieren Sie den resultierenden Ausgabestring, um ihn im Platzhalter
SOURCE_DEFINITIONzu verwenden, falls Sie sich später in diesen Schritten für die Verwendung des alternativen Befehlscurlentscheiden.Verwenden Sie die
projects.locations.repositories.workspaces.writeFile-Methode, um eine Quelldeklarationsdatei in Ihrem Arbeitsbereich zu erstellen. Führen Sie die API-Anfrage mit den folgenden Informationen aus:- Endpunkt:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile
Alternativ können Sie im Terminal den folgenden
curl-Befehl ausführen:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "path": "definitions/sources/tags.sqlx", "contents": "SOURCE_DEFINITION" }' \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile"Ersetzen Sie
SOURCE_DEFINITIONdurch den Inhalt der SQLX-Datei als Base64-codierten String.- Endpunkt:
Sie haben eine Quellendeklaration erstellt. Als Nächstes können Sie Ihrem Projekt eine neue Ansicht hinzufügen.
Ansicht erstellen
In diesem Abschnitt fügen Sie Ihrem Projekt eine neue SQLX-Datei hinzu, in der eine Ansicht definiert wird. Wählen Sie eine der folgenden Optionen aus, um die neue Ansicht zu erstellen:
Console
Rufen Sie die BigQuery-Seite Dataform auf.
Klicken Sie auf
quickstart-repo.Rufen Sie in Ihrem Repository den Tab Entwicklungsarbeitsbereiche auf und klicken Sie dann auf
dev-workspace.Wählen Sie im Bereich Dateien den Ordner
definitionsaus.Klicken Sie auf Weitere Dateiaktionen > Datei erstellen.
Geben Sie im Feld Dateipfad hinzufügen
definitions/top_question_tags.sqlxein.Klicken Sie auf Datei erstellen.
Fügen Sie im SQL-Editor für die neue Datei
definitions/top_question_tags.sqlxden folgenden Code ein:config { type: "view", name: "top_question_tags", tags: ["daily"], schema: "reporting", } select tag_name, count from ${ref("tags")} order by count desc limit 100
Sie haben eine Ansicht erstellt. Als Nächstes können Sie Ihr Projekt kompilieren.
API
- Erstellen Sie eine lokale Datei mit dem Namen
top_question_tags.sqlx. Fügen Sie den folgenden Code in die
top_question_tags.sqlx-Datei ein:config { type: "view", name: "top_question_tags", tags: ["daily"], schema: "reporting", } select tag_name, count from ${ref("tags")} order by count desc limit 100Codieren Sie im Terminal den Dateiinhalt in einen einzelnen fortlaufenden String:
base64 -w 0 top_question_tags.sqlxKopieren Sie den resultierenden Ausgabestring, um ihn im Platzhalter
VIEW_DEFINITIONzu verwenden, falls Sie sich entscheiden, den alternativen Befehlcurlspäter in diesen Schritten zu verwenden.Verwenden Sie die Methode
projects.locations.repositories.workspaces.writeFile, um eine Ansichtsdefinitionsdatei in Ihrem Arbeitsbereich zu erstellen. Führen Sie die API-Anfrage mit den folgenden Informationen aus:- Endpunkt:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile
Alternativ können Sie im Terminal den folgenden
curl-Befehl ausführen:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "path": "definitions/top_question_tags.sqlx", "contents": "VIEW_DEFINITION" }' \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile"Ersetzen Sie
VIEW_DEFINITIONdurch den Inhalt der SQLX-Datei als Base64-codierten String.- Endpunkt:
Sie haben eine Ansicht erstellt. Als Nächstes können Sie Ihr Projekt kompilieren.
Projekt kompilieren
Bei der Kompilierung werden SQLX-Dateien in einen reinen SQL-Ausführungsgraphen konvertiert. Wählen Sie eine der folgenden Optionen aus, um das Projekt zu kompilieren:
Console
Die Google Cloud Console kompiliert Ihr Projekt automatisch. Sie können die Kompilierung im kompilierten Diagramm in Ihrem Arbeitsbereich überprüfen.
Sie haben Ihr Projekt kompiliert und den Ausführungsgraphen überprüft. Als Nächstes können Sie Ihren Workflow in BigQuery ausführen.
API
Verwenden Sie die Methode
projects.locations.repositories.compilationResults.create, um ein Kompilierungsergebnis basierend auf Ihrem Arbeitsbereich zu erstellen. Führen Sie die API-Anfrage mit den folgenden Informationen aus:- Endpunkt:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults
Alternativ können Sie im Terminal den folgenden
curl-Befehl ausführen:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "workspace": "projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID" }' \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults"- Endpunkt:
Mit der Methode
projects.locations.repositories.compilationResults.getkönnen Sie prüfen, ob Ihr Projekt erfolgreich kompiliert wurde. Führen Sie die API-Anfrage mit den folgenden Informationen aus:- Endpunkt:
GET https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults/COMPILATION_ID
Alternativ können Sie im Terminal den folgenden
curl-Befehl ausführen:curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults/COMPILATION_ID"Ersetzen Sie
COMPILATION_IDdurch die eindeutige Kennzeichnung für Ihr Kompilierungsergebnis. Diese ID wird in der Antwort auf die Kompilierungsanfrage im vorherigen Schritt angegeben.- Endpunkt:
Prüfen Sie in der Antwort das Feld
compilationErrors. Wenn die Liste leer ist, wurde Ihr Projekt kompiliert.
Sie haben Ihr Projekt kompiliert und den Ausführungsgraphen überprüft. Als Nächstes können Sie Ihren Workflow in BigQuery ausführen.
Workflow ausführen
Wenn Sie die Ausführung Ihres Workflows in BigQuery auslösen möchten, wählen Sie eine der folgenden Optionen aus:
Console
Rufen Sie die BigQuery-Seite Dataform auf.
Klicken Sie auf
quickstart-repo.Rufen Sie in Ihrem Repository den Tab Entwicklungsarbeitsbereiche auf und klicken Sie dann auf
dev-workspace.Klicken Sie in der Symbolleiste auf Ausführung starten > Aktionen ausführen.
Wählen Sie Alle Aktionen aus.
Klicken Sie auf Ausführung starten.
Sie haben Ihren Workflow erfolgreich ausgeführt.
API
Verwenden Sie zum Auslösen eines Workflow-Aufrufs die Methode projects.locations.repositories.workflowInvocations.create.
Führen Sie die API-Anfrage mit den folgenden Informationen aus:
- Endpunkt:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations
Alternativ können Sie im Terminal den folgenden curl-Befehl ausführen:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d '{
"compilationResult": "projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults/COMPILATION_ID"
}' \
"https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations"
Sie haben Ihren Workflow erfolgreich ausgeführt.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud -Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:
BigQuery-Datasets löschen
Löschen Sie die von diesem Workflow erstellten Datasets, z. B. die Datasets mit den Namen reporting und staging, um zu vermeiden, dass für BigQuery-Assets Gebühren in Rechnung gestellt werden.
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und wählen Sie ein Dataset aus.
Klicken Sie auf das Menü Aktionen und wählen Sie Löschen aus.
Geben Sie im Dialogfeld Dataset löschen den Wert
deletein das Feld ein und klicken Sie auf Löschen.
Secret Manager-Secret löschen
Um Ihre Sicherheitsressourcen zu bereinigen, löschen Sie das für die Git-Verbindung verwendete Secret.
Rufen Sie in der Google Cloud Console die Seite Secret Manager auf.
Wählen Sie das Secret
dataform-git-tokenaus.Klicken Sie auf Löschen.
Geben Sie im Bestätigungsdialogfeld den Namen des Secrets ein und klicken Sie auf Löschen.
Entwicklungsarbeitsbereich für Dataform löschen
Für das Erstellen von Entwicklungsarbeitsbereichen für Dataform fallen keine Kosten an. Wenn Sie den Entwicklungsarbeitsbereich löschen möchten, gehen Sie so vor:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie auf
quickstart-repo.Klicken Sie auf dem Tab Entwicklungsarbeitsbereiche auf das Menü Mehr
dev-workspaceund wählen Sie dann Löschen aus.Klicken Sie zur Bestätigung auf Löschen.
Dataform-Repository löschen
Für das Erstellen von Dataform-Repositories fallen keine Kosten an. So löschen Sie ein Repository:
Rufen Sie in der Google Cloud Console die Seite Dataform auf.
Klicken Sie neben
quickstart-repoauf das Menü Mehr und wählen Sie Löschen aus.Geben Sie im Fenster Repository löschen den Namen des Repositorys ein, um das Löschen zu bestätigen.
Klicken Sie zur Bestätigung auf Löschen.
Nächste Schritte
- Informationen zum Deklarieren von Datenquellen in Dataform finden Sie unter Datenquelle deklarieren.
- Informationen zum Erstellen von Ansichten und Tabellen in Dataform finden Sie unter Tabellen erstellen.
- Weitere Informationen zur Versionsverwaltung in Dataform finden Sie unter Code verwalten.
- Informationen zum Planen von Workflow-Ausführungen finden Sie unter Ausführungen mit Workflow-Konfigurationen planen.