Conecta un repositorio de Git y ejecuta un flujo de trabajo
En esta guía de inicio rápido, se te guiará por el proceso de crear un repositorio de Dataform, conectarlo a un repositorio de Git externo existente y ejecutar un flujo de trabajo. Realiza las siguientes tareas con la consola deGoogle Cloud y la API de Dataform:
- Crear un repositorio de Dataform
- Conecta el repositorio al repositorio de
dataform-co/dataform-example-project-bigqueryGitHub. - Crea e inicializa un espacio de trabajo de desarrollo.
- Agrega una vista nueva al proyecto.
- Compila el proyecto y ejecuta el flujo de trabajo en BigQuery.
Antes de comenzar
- Accede a tu cuenta de Google Cloud . Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, Dataform, and Secret Manager APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, Dataform, and Secret Manager APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Roles obligatorios
Si quieres obtener los permisos que necesitas para realizar todas las tareas de esta guía de inicio rápido, pídele a tu administrador que te otorgue los siguientes roles de IAM:
- Administrador de Dataform (
roles/dataform.admin) en el proyecto o repositorio - Editor de datos de BigQuery (
roles/bigquery.dataEditor) en el proyecto o en conjuntos de datos específicos - Usuario de trabajo de BigQuery (
roles/bigquery.jobUser) en el proyecto - Usuario de la cuenta de servicio (
roles/iam.serviceAccountUser) en la cuenta de servicio personalizada
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.
Crea un repositorio de Dataform
Un repositorio es el contenedor principal de tu proyecto de Dataform. Selecciona una de las siguientes opciones:
Console
Ve a la página Dataform de BigQuery.
Haz clic en Crear repositorio.
En la página Crear repositorio, haz lo siguiente:
- En el campo ID del repositorio, ingresa
quickstart-repo. - En la lista Región, selecciona una región, por ejemplo,
europe-west4. - En la lista Cuenta de servicio, selecciona una cuenta de servicio personalizada para el repositorio.
- Haz clic en Crear.
- Haz clic en Ir a repositorios.
- En el campo ID del repositorio, ingresa
Creaste correctamente un repositorio de Dataform. A continuación, puedes conectar el repositorio de Dataform a un repositorio de Git remoto.
API
Para crear un repositorio, usa el método projects.locations.repositories.create.
Ejecuta la solicitud a la API con la siguiente información:
- Endpoint:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories - Parámetro de consulta:
repositoryId=REPOSITORY_ID
Como alternativa, en tu terminal, ejecuta el siguiente comando curl:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d '{"serviceAccount": "SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com"}' \
"https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories?repositoryId=REPOSITORY_ID"
Reemplaza lo siguiente:
SERVICE_ACCOUNT_NAME: Es el ID de la cuenta de servicio personalizada que se creó para ejecutar trabajos de BigQuery.PROJECT_ID: Es el identificador único del proyecto deGoogle Cloud en el que deseas crear el repositorio de Dataform.LOCATION: La región de Google Cloud en la que deseas crear el repositorio, por ejemplo,europe-west4.REPOSITORY_ID: Es el identificador único de tu nuevo repositorio de Dataform, por ejemplo,quickstart-repo.
Creaste correctamente un repositorio de Dataform. A continuación, puedes conectar el repositorio de Dataform a un repositorio de Git remoto.
Conéctate al repositorio de Git
Para conectar tu repositorio de Dataform a tu proyecto, selecciona una de las siguientes opciones:
Console
Ve a la página de Secret Manager.
Haz clic en Crear secreto.
En el campo Nombre, ingresa
dataform-git-token.En el campo Valor del secreto, ingresa tu token de acceso personal (PAT) de GitHub.
Para obtener instrucciones sobre cómo crear un PAT, consulta Administra tus tokens de acceso personal.
Te recomendamos que establezcas una fecha de vencimiento para tu token según las políticas de seguridad de tu organización.
Haz clic en Crear secreto.
En la página de detalles del secreto, haz clic en la pestaña Permisos y, luego, en Otorgar acceso.
En el campo Principales nuevas, ingresa tu agente de servicio de Dataform:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com.Reemplaza
PROJECT_NUMBERpor el número de proyecto deGoogle Cloud . Para obtener detalles sobre cómo encontrar el número de tu proyecto, consulta Cómo encontrar el nombre, el número y el ID del proyecto.En el campo Selecciona un rol, selecciona Secret Manager > Secret Manager Secret Accessor.
Haz clic en Guardar.
En la consola de Google Cloud , ve a la página Dataform.
Haz clic en
quickstart-repo.En la página del repositorio, haz clic en Configuración > Conectar con Git.
En el panel Vincular a un repositorio remoto, selecciona HTTPS.
En el campo URL del repositorio de Git remoto, ingresa
https://github.com/dataform-co/dataform-example-project-bigquery.git.En el campo Nombre de rama remota predeterminado, ingresa
master.En el menú Secret, selecciona
dataform-git-token.Haz clic en Vincular.
Conectaste correctamente tu repositorio de Dataform a un repositorio de Git remoto y otorgaste los permisos necesarios. A continuación, puedes crear e inicializar un espacio de trabajo de desarrollo.
API
Para almacenar tu token de acceso personal de Git, crea un secreto en Secret Manager con el método
projects.secrets.create. Ejecuta la solicitud a la API con la siguiente información:- Endpoint:
POST https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets - Parámetro de consulta:
secretId=dataform-git-token Cuerpo:
{ "replication": { "automatic": {} } }
Como alternativa, en tu terminal, ejecuta el siguiente comando
curl:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "replication": { "automatic": {} } }' \ "https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets?secretId=dataform-git-token"- Endpoint:
Agrega una versión al secreto que contiene tu token de acceso personal (PAT) de GitHub. Para obtener instrucciones sobre cómo crear un PAT, consulta Administra tus tokens de acceso personal. Te recomendamos que establezcas una fecha de vencimiento para tu token según las políticas de seguridad de tu organización.
Para agregar una versión del secreto, usa el método
projects.secrets.addVersion. Ejecuta la solicitud a la API con la siguiente información:- Endpoint:
POST https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/dataform-git-token:addVersion Cuerpo:
{ "payload": { "data": "GITHUB_PAT" } }
Como alternativa, en tu terminal, ejecuta el siguiente comando
curl:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "payload": { "data": "$(echo -n "GITHUB_PAT" | base64)" } }' \ "https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/dataform-git-token:addVersion"Reemplaza
GITHUB_PATpor tu token de acceso personal de GitHub. El comandocurlconvierte automáticamente tu PAT en una cadena codificada en Base64 antes de enviar la solicitud.- Endpoint:
Para permitir que Dataform acceda al secreto, otorga el rol de Secret Manager Secret Accessor (
roles/secretmanager.secretAccessor) al agente de servicio de Dataform. Para otorgar el rol, selecciona una de las siguientes opciones:gcloud
Ejecuta el comando
gcloud secrets add-iam-policy-binding:gcloud secrets add-iam-policy-binding dataform-git-token \ --member="serviceAccount:service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com" \ --role="roles/secretmanager.secretAccessor"Reemplaza
PROJECT_NUMBERpor el número de proyecto deGoogle Cloud . Para obtener detalles sobre cómo encontrar el número de tu proyecto, consulta Cómo encontrar el nombre, el número y el ID del proyecto.API de Secret Manager
Usa el método
projects.secrets.setIamPolicy. Ejecuta la solicitud a la API con la siguiente información:- Endpoint:
POST https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/dataform-git-token:setIamPolicy Cuerpo:
{ "policy": { "bindings": [ { "role": "roles/secretmanager.secretAccessor", "members": [ "serviceAccount:service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com" ] } ] } }
Como alternativa, en tu terminal, ejecuta el siguiente comando
curl:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "policy": { "bindings": [ { "role": "roles/secretmanager.secretAccessor", "members": [ "serviceAccount:service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com" ] } ] } }' \ "https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/dataform-git-token:setIamPolicy"Reemplaza
PROJECT_NUMBERpor el número de proyecto deGoogle Cloud . Para obtener detalles sobre cómo encontrar el número de tu proyecto, consulta Cómo encontrar el nombre, el número y el ID del proyecto.- Endpoint:
Para conectar tu repositorio a un repositorio de Git remoto, usa el método
projects.locations.repositories.patch. Ejecuta la solicitud a la API con la siguiente información:- Endpoint:
PATCH https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID - Parámetro de consulta:
updateMask=gitRemoteSettings
Como alternativa, en tu terminal, ejecuta el siguiente comando
curl:curl -X PATCH \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "gitRemoteSettings": { "url": "https://github.com/dataform-co/dataform-example-project-bigquery.git", "defaultBranch": "master", "authenticationTokenSecretVersion": "projects/PROJECT_ID/secrets/dataform-git-token/versions/1" } }' \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID?updateMask=gitRemoteSettings"- Endpoint:
Conectaste correctamente tu repositorio de Dataform a un repositorio de Git remoto y otorgaste los permisos necesarios. A continuación, puedes crear e inicializar un espacio de trabajo de desarrollo.
Crea e inicializa un espacio de trabajo de desarrollo
Un espacio de trabajo es un entorno de desarrollo aislado. Para crear e inicializar un espacio de trabajo, selecciona una de las siguientes opciones:
Console
Ve a la página Dataform de BigQuery.
Haz clic en
quickstart-repo.En tu repositorio, ve a la pestaña Development Workspaces.
Haz clic en Crear lugar de trabajo de desarrollo.
En el campo ID del lugar de trabajo, ingresa
dev-workspace.Haz clic en Crear.
En la pestaña Lugares de trabajo de desarrollo, selecciona el lugar de trabajo
dev-workspace.
Creaste e inicializaste correctamente un espacio de trabajo de desarrollo. A continuación, puedes configurar los parámetros del flujo de trabajo.
API
Para crear un espacio de trabajo, usa el método projects.locations.repositories.workspaces.create.
Ejecuta la solicitud a la API con la siguiente información:
- Endpoint:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces - Parámetro de consulta:
workspaceId=WORKSPACE_ID
Como alternativa, en tu terminal, ejecuta el siguiente comando curl:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{}" \
"https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces?workspaceId=WORKSPACE_ID"
Reemplaza WORKSPACE_ID por el identificador único de tu nuevo espacio de trabajo de desarrollo de Dataform, por ejemplo, dev-workspace.
Creaste e inicializaste correctamente un espacio de trabajo de desarrollo. A continuación, puedes configurar los parámetros del flujo de trabajo.
Configura los parámetros del flujo de trabajo
En esta sección, actualizarás el ID del proyecto en el archivo workflow_settings.yaml para asegurarte de que Dataform ejecute el flujo de trabajo en tu proyectoGoogle Cloud . Para configurar los parámetros del flujo de trabajo, selecciona una de las siguientes opciones:
Console
Ve a la página Dataform de BigQuery.
Haz clic en
quickstart-repo.En tu repositorio, ve a la pestaña Development Workspaces y, luego, haz clic en
dev-workspace.En el panel Archivos, selecciona
workflow_settings.yaml.En el archivo, reemplaza el valor de
defaultProjectpor el ID de tu proyecto.El archivo se guarda automáticamente.
Actualizaste correctamente la configuración del flujo de trabajo. A continuación, puedes agregar una nueva declaración de fuente a tu proyecto.
API
Crea un archivo local llamado
workflow_settings.yamly pega la siguiente configuración en él:defaultProject: PROJECT_ID defaultDataset: dataform dataformCoreVersion: CORE_VERSIONReemplaza
CORE_VERSIONpor la versión estable (no beta) más reciente de Dataform Core, por ejemplo,3.0.43. Puedes encontrar la versión más reciente en Releases.En tu terminal, codifica el contenido del archivo en una cadena Base64:
base64 -w 0 workflow_settings.yamlCopia la cadena de salida resultante para usarla en el marcador de posición
SETTINGS_DEFINITIONsi decides usar el comandocurlalternativo más adelante en estos pasos.Para actualizar la configuración de tu flujo de trabajo, usa el método
projects.locations.repositories.workspaces.writeFile. Ejecuta la solicitud a la API con la siguiente información:- Endpoint:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile
Como alternativa, en tu terminal, ejecuta el siguiente comando
curl:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "path": "workflow_settings.yaml", "contents": "SETTINGS_DEFINITION" }' \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile"Reemplaza
SETTINGS_DEFINITIONpor el contenido del archivo YAML como una cadena codificada en Base64.- Endpoint:
Actualizaste correctamente la configuración del flujo de trabajo. A continuación, puedes agregar una nueva declaración de fuente a tu proyecto.
Crea una fuente
En esta sección, agregarás una nueva declaración de fuente SQLX a tu proyecto que defina un conjunto de datos existente de BigQuery para que Dataform pueda hacer referencia a él como una fuente de datos en tu flujo de trabajo. Para crear la nueva fuente, selecciona una de las siguientes opciones:
Console
Ve a la página Dataform de BigQuery.
Haz clic en
quickstart-repo.En tu repositorio, ve a la pestaña Development Workspaces y, luego, haz clic en
dev-workspace.En el panel Archivos, selecciona la carpeta
definitions.Haz clic en Más acciones de archivo > Crear archivo.
En el campo Agregar una ruta de acceso al archivo, ingresa
definitions/sources/tags.sqlx.Haz clic en Crear archivo.
En el editor de SQL del nuevo archivo
definitions/sources/tags.sqlx, pega el siguiente código:config { type: "declaration", database: "bigquery-public-data", schema: "stackoverflow", name: "tags" }
Creaste correctamente una declaración de fuente. A continuación, puedes agregar una vista nueva a tu proyecto.
API
- Crea un archivo local llamado
tags.sqlx. Pega el siguiente código en el archivo
tags.sqlx:config { type: "declaration", database: "bigquery-public-data", schema: "stackoverflow", name: "tags" }En tu terminal, codifica el contenido del archivo en una sola cadena continua:
base64 -w 0 tags.sqlxCopia la cadena de salida resultante para usarla en el marcador de posición
SOURCE_DEFINITIONsi decides usar el comandocurlalternativo más adelante en estos pasos.Para crear un archivo de declaración de fuente en tu espacio de trabajo, usa el método
projects.locations.repositories.workspaces.writeFile. Ejecuta la solicitud a la API con la siguiente información:- Endpoint:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile
Como alternativa, en tu terminal, ejecuta el siguiente comando
curl:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "path": "definitions/sources/tags.sqlx", "contents": "SOURCE_DEFINITION" }' \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile"Reemplaza
SOURCE_DEFINITIONpor el contenido del archivo .sqlx como una cadena codificada en Base64.- Endpoint:
Creaste correctamente una declaración de fuente. A continuación, puedes agregar una vista nueva a tu proyecto.
Crea una vista
En esta sección, agregarás un nuevo archivo SQLX a tu proyecto que defina una vista. Para crear la vista nueva, selecciona una de las siguientes opciones:
Console
Ve a la página Dataform de BigQuery.
Haz clic en
quickstart-repo.En tu repositorio, ve a la pestaña Development Workspaces y, luego, haz clic en
dev-workspace.En el panel Archivos, selecciona la carpeta
definitions.Haz clic en Más acciones de archivo > Crear archivo.
En el campo Agregar una ruta de acceso al archivo, ingresa
definitions/top_question_tags.sqlx.Haz clic en Crear archivo.
En el editor de SQL del nuevo archivo
definitions/top_question_tags.sqlx, pega el siguiente código:config { type: "view", name: "top_question_tags", tags: ["daily"], schema: "reporting", } select tag_name, count from ${ref("tags")} order by count desc limit 100
Creaste una vista correctamente. A continuación, puedes compilar tu proyecto.
API
- Crea un archivo local llamado
top_question_tags.sqlx. Pega el siguiente código en el archivo
top_question_tags.sqlx:config { type: "view", name: "top_question_tags", tags: ["daily"], schema: "reporting", } select tag_name, count from ${ref("tags")} order by count desc limit 100En tu terminal, codifica el contenido del archivo en una sola cadena continua:
base64 -w 0 top_question_tags.sqlxCopia la cadena de salida resultante para usarla en el marcador de posición
VIEW_DEFINITIONsi decides usar el comandocurlalternativo más adelante en estos pasos.Para crear un archivo de definición de vista en tu espacio de trabajo, usa el método
projects.locations.repositories.workspaces.writeFile. Ejecuta la solicitud a la API con la siguiente información:- Endpoint:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile
Como alternativa, en tu terminal, ejecuta el siguiente comando
curl:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "path": "definitions/top_question_tags.sqlx", "contents": "VIEW_DEFINITION" }' \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile"Reemplaza
VIEW_DEFINITIONpor el contenido del archivo .sqlx como una cadena codificada en Base64.- Endpoint:
Creaste una vista correctamente. A continuación, puedes compilar tu proyecto.
Compila el proyecto
La compilación convierte los archivos SQLX en un gráfico de ejecución de SQL puro. Para compilar el proyecto, selecciona una de las siguientes opciones:
Console
La consola de Google Cloud compila tu proyecto automáticamente. Puedes verificar la compilación en la pestaña Gráfico compilado de tu espacio de trabajo.
Compilaste correctamente tu proyecto y verificaste el gráfico de ejecución. A continuación, puedes ejecutar tu flujo de trabajo en BigQuery.
API
Para crear un resultado de compilación basado en tu espacio de trabajo, usa el método
projects.locations.repositories.compilationResults.create. Ejecuta la solicitud a la API con la siguiente información:- Endpoint:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults
Como alternativa, en tu terminal, ejecuta el siguiente comando
curl:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d '{ "workspace": "projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID" }' \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults"- Endpoint:
Para verificar que tu proyecto se compiló correctamente, usa el método
projects.locations.repositories.compilationResults.get. Ejecuta la solicitud a la API con la siguiente información:- Endpoint:
GET https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults/COMPILATION_ID
Como alternativa, en tu terminal, ejecuta el siguiente comando
curl:curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults/COMPILATION_ID"Reemplaza
COMPILATION_IDpor el identificador único del resultado de la compilación. Este ID se proporciona en la respuesta de la solicitud de compilación del paso anterior.- Endpoint:
En la respuesta, verifica el campo
compilationErrors. Si la lista está vacía, tu proyecto se compiló correctamente.
Compilaste correctamente tu proyecto y verificaste el gráfico de ejecución. A continuación, puedes ejecutar tu flujo de trabajo en BigQuery.
Ejecuta el flujo de trabajo
Para activar la ejecución de tu flujo de trabajo en BigQuery, selecciona una de las siguientes opciones:
Console
Ve a la página Dataform de BigQuery.
Haz clic en
quickstart-repo.En tu repositorio, ve a la pestaña Development Workspaces y, luego, haz clic en
dev-workspace.En la barra de herramientas, haz clic en Iniciar ejecución > Ejecutar acciones.
Selecciona Todas las acciones.
Haz clic en Iniciar ejecución.
Ejecutaste correctamente tu flujo de trabajo.
API
Para activar una invocación de flujo de trabajo, usa el método projects.locations.repositories.workflowInvocations.create.
Ejecuta la solicitud a la API con la siguiente información:
- Endpoint:
POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations
Como alternativa, en tu terminal, ejecuta el siguiente comando curl:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d '{
"compilationResult": "projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults/COMPILATION_ID"
}' \
"https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations"
Ejecutaste correctamente tu flujo de trabajo.
Realiza una limpieza
Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.
Borra los conjuntos de datos de BigQuery
Para evitar que se generen cargos por los recursos de BigQuery, borra los conjuntos de datos creados por este flujo de trabajo, como los conjuntos de datos llamados reporting y staging.
En la consola de Google Cloud , ve a la página BigQuery.
En el panel Explorador, expande tu proyecto y selecciona un conjunto de datos.
Haz clic en el menú Acciones y, luego, selecciona Borrar.
En el cuadro de diálogo Borrar conjunto de datos, ingresa
deleteen el campo y, luego, haz clic en Borrar.
Borra el secreto de Secret Manager
Para limpiar tus recursos de seguridad, borra el secreto que se usó para la conexión de Git.
En la consola de Google Cloud , ve a la página Secret Manager.
Selecciona el secreto
dataform-git-token.Haz clic en Borrar.
En el diálogo de confirmación, ingresa el nombre del secreto para confirmar y, luego, haz clic en Borrar.
Borra el lugar de trabajo de desarrollo de Dataform
La creación de un espacio de trabajo de desarrollo de Dataform no genera costos, pero, para borrarlo, sigue estos pasos:
En la consola de Google Cloud , ve a la página Dataform.
Haz clic en
quickstart-repo.En la pestaña Lugares de trabajo de desarrollo, haz clic en el menú Más de
dev-workspacey, luego, selecciona Borrar.Para confirmar la acción, haz clic en Borrar.
Borra el repositorio de Dataform
La creación de repositorios de Dataform no genera costos, pero para borrar el repositorio, sigue estos pasos:
En la consola de Google Cloud , ve a la página Dataform.
En
quickstart-repo, haz clic en el menú Más y, luego, selecciona Borrar.En la ventana Borrar repositorio, ingresa el nombre del repositorio para confirmar su eliminación.
Para confirmar la acción, haz clic en Borrar.
¿Qué sigue?
- Para obtener información sobre cómo declarar fuentes de datos en Dataform, consulta Cómo declarar una fuente de datos.
- Para aprender a crear vistas y tablas en Dataform, consulta Crea tablas.
- Para obtener más información sobre el control de versión en Dataform, consulta Controla la versión de tu código.
- Para obtener información sobre cómo programar ejecuciones de flujos de trabajo, consulta Programa ejecuciones con configuraciones de flujos de trabajo.