Crea y ejecuta un flujo de trabajo en Dataform

Esta guía de inicio rápido está dirigida a ingenieros y analistas de datos que desean administrar transformaciones de datos en BigQuery. En esta guía de inicio rápido, aprenderás a crear y ejecutar un flujo de trabajo de Dataform con Dataform Core, un framework basado en SQL para transformar datos sin procesar en recursos de datos seleccionados, probados y documentados. Con Dataform, puedes desarrollar y controlar las versiones de tus canalizaciones de modelado de datos en un repositorio central, lo que garantiza la confiabilidad y la escalabilidad.

En esta guía de inicio rápido, se te guiará por el siguiente proceso en Dataform para crear un flujo de trabajo y ejecutarlo en BigQuery:

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud . Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery and Dataform APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery and Dataform APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

Roles obligatorios

Si quieres obtener los permisos que necesitas para realizar todas las tareas de esta guía de inicio rápido, pídele a tu administrador que te otorgue los siguientes roles de IAM:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Otorga roles necesarios

Para ejecutar flujos de trabajo en BigQuery, puedes usar una cuenta de servicio personalizada o tu Cuenta de Google.

Tu cuenta de servicio personalizada debe tener los siguientes roles obligatorios:

  • Editor de datos de BigQuery (roles/bigquery.dataEditor) en proyectos o conjuntos de datos específicos de BigQuery a los que Dataform necesita acceso de lectura y escritura. Por lo general, esto incluye el proyecto que aloja tu repositorio de Dataform.
  • Visualizador de datos de BigQuery (roles/bigquery.dataViewer) en proyectos o conjuntos de datos específicos de BigQuery a los que Dataform necesita acceso de solo lectura
  • Usuario de trabajo de BigQuery (roles/bigquery.jobUser) en el proyecto que aloja tu repositorio de Dataform.

Para permitir que Dataform use tu cuenta de servicio personalizada, el agente de servicio predeterminado de Dataform debe tener los siguientes roles en el recurso de la cuenta de servicio personalizada:

Para otorgar estos roles, sigue estos pasos:

  1. En la consola de Google Cloud , dirígete a la página IAM.

    Ir a IAM

  2. Haz clic en Otorgar acceso.

  3. En el campo Principales nuevas, ingresa el ID de tu cuenta de servicio personalizada.

  4. En el menú Seleccionar un rol, selecciona los siguientes roles uno por uno con la opción Agregar otro rol para cada rol adicional:

    • Editor de datos de BigQuery
    • Lector de datos de BigQuery
    • Usuario de trabajo de BigQuery
  5. Haz clic en Guardar.

  6. En la consola de Google Cloud , ve a la página Cuentas de servicio.

    Ir a Cuentas de servicio

  7. Selecciona tu cuenta de servicio personalizada.

  8. Ve a Principales con acceso y, luego, haz clic en Otorgar acceso.

  9. En el campo Principales nuevas, ingresa el ID de tu agente de servicio predeterminado de Dataform.

    Tu ID del agente de servicio de Dataform predeterminado tiene el siguiente formato:

    service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
    

    Reemplaza PROJECT_NUMBER por el ID numérico de tu proyecto deGoogle Cloud . Puedes encontrar el ID de tu proyecto Google Cloud en elGoogle Cloud panel de la consola. Para obtener más información, consulta Identifica proyectos.

  10. En la lista Seleccionar un rol, agrega los siguientes roles:

    • Service Account User
    • Creador de tokens de cuenta de servicio
  11. Haz clic en Guardar.

Para obtener más información sobre cómo otorgar roles, consulta Otorga a Dataform el acceso requerido.

Crea un repositorio de Dataform

Un repositorio de Dataform es un recurso que representa un repositorio de Git que contiene código de proyecto de Dataform que se usa para desarrollar, control de versión y organizar flujos de trabajo. Para crear un repositorio, selecciona una de las siguientes opciones:

Console

  1. En la consola de Google Cloud , ve a la página Dataform de BigQuery.

    Ir a Dataform

  2. Haz clic en Crear repositorio.

  3. En la página Crear repositorio, haz lo siguiente:

    1. En el campo ID del repositorio, ingresa quickstart-repository.

    2. En la lista Región, selecciona europe-west4.

    3. En la lista Cuenta de servicio, selecciona una cuenta de servicio personalizada para el repositorio.

    4. En la sección Verificaciones de permisos de actAs, aplica verificaciones de permisos en las acciones del usuario para el repositorio.

    5. Haz clic en Crear.

    6. Haz clic en Ir a repositorios.

Creaste correctamente un repositorio de Dataform. A continuación, puedes crear e inicializar un espacio de trabajo de desarrollo.

API

Para crear un repositorio, usa el método projects.locations.repositories.create.

Ejecuta la solicitud a la API con la siguiente información:

  • Endpoint: POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories
  • Parámetro de consulta: repositoryId=REPOSITORY_ID

Comando curl:

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  -d '{"serviceAccount": "SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com"}' \
  "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories?repositoryId=REPOSITORY_ID"

Reemplaza lo siguiente:

  • LOCATION: La Google Cloud región en la que deseas crear el repositorio, por ejemplo, europe-west4.
  • PROJECT_ID: Es el identificador único del proyecto deGoogle Cloud en el que deseas crear el repositorio de Dataform.
  • REPOSITORY_ID: Es el identificador único de tu nuevo repositorio de Dataform, por ejemplo, quickstart-repository.
  • SERVICE_ACCOUNT_NAME: Es el ID de la cuenta de servicio personalizada que se creó para ejecutar trabajos de BigQuery.

Crea e inicializa un espacio de trabajo de desarrollo

Un espacio de trabajo de Dataform es un entorno de desarrollo aislado, como una rama de Git, en el que puedes editar y compilar código. Para crear un espacio de trabajo, selecciona una de las siguientes opciones:

Console

  1. En la consola de Google Cloud , ve a la página Dataform de BigQuery.

    Ir a Dataform

  2. Haz clic en quickstart-repository.

  3. Haz clic en Crear lugar de trabajo de desarrollo.

  4. En la ventana Crear espacio de trabajo de desarrollo, haz lo siguiente:

    1. En el campo ID del lugar de trabajo, ingresa quickstart-workspace.

    2. Haz clic en Crear.

    Aparecerá la página del espacio de trabajo de desarrollo.

  5. Haga clic en Inicializar espacio de trabajo.

API

  1. Para crear un espacio de trabajo de Dataform, usa el método projects.locations.repositories.workspaces.create.

    Ejecuta la solicitud a la API con la siguiente información:

    • Endpoint: POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces
    • Parámetro de consulta: workspaceId=WORKSPACE_ID

    Comando curl:

    curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      -d "{}" \
      "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces?workspaceId=WORKSPACE_ID"
    
  2. Para inicializar tu espacio de trabajo con la configuración necesaria, crea un archivo local llamado workflow_settings.yaml y pega la siguiente configuración:

    defaultProject: PROJECT_ID
    defaultDataset: dataform
    dataformCoreVersion: CORE_VERSION
    
  3. En tu terminal, ejecuta el siguiente comando para codificar el contenido del archivo en una sola cadena continua:

    base64 -w 0 workflow_settings.yaml
    
  4. Copia la cadena de salida resultante para usarla en el campo SETTINGS_DEFINITION del cuerpo de la solicitud JSON.

  5. Para crear el archivo de configuración en tu espacio de trabajo, usa el método projects.locations.repositories.workspaces.writeFile.

    Ejecuta la solicitud a la API con la siguiente información:

    • Endpoint: POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile

    Comando curl:

    curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      -d '{
        "path": "workflow_settings.yaml",
        "contents": "SETTINGS_DEFINITION"
      }' \
      "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile"
    

    Reemplaza lo siguiente:

    • CORE_VERSION: Es la versión estable más reciente (no beta) de Dataform Core, por ejemplo, 3.0.43. Puedes encontrar la versión más reciente en Releases.
    • LOCATION: Es la Google Cloud región de tu repositorio, por ejemplo, europe-west4.
    • PROJECT_ID: Es el identificador único del proyecto deGoogle Cloud en el que se encuentra tu repositorio de Dataform.
    • REPOSITORY_ID: Es el identificador único de tu repositorio de Dataform, por ejemplo, quickstart-repository.
    • SETTINGS_DEFINITION: Es el contenido del archivo YAML como una cadena codificada en Base64.
    • WORKSPACE_ID: Es el identificador único de tu espacio de trabajo de desarrollo de Dataform, por ejemplo, feature-branch-1.

Crea una vista

Una vista de Dataform es un recurso definido en un archivo SQLX que te permite transformar datos y sirve como fuente para otras tablas o vistas en tu flujo de trabajo. Para crear y definir una vista que luego usarás como fuente de datos para una tabla, selecciona una de las siguientes opciones:

Console

  1. En la consola de Google Cloud , ve a la página Dataform de BigQuery.

    Ir a Dataform

  2. Haz clic en quickstart-repository y, luego, en quickstart-workspace.

  3. En el panel Archivos, junto a definitions/, haz clic en el menú Más.

  4. Haz clic en Crear archivo.

  5. En el panel Crear un archivo nuevo, haz lo siguiente:

    1. En el campo Agregar una ruta de archivo, ingresa definitions/quickstart-source.sqlx.

    2. Haz clic en Crear archivo.

  6. En el panel Archivos, expande la carpeta definitions.

  7. Haz clic en definitions/quickstart-source.sqlx.

  8. En el archivo, ingresa el siguiente fragmento de código:

    config {
      type: "view"
    }
    
    SELECT
      "apples" AS fruit,
      2 AS count
    UNION ALL
    SELECT
      "oranges" AS fruit,
      5 AS count
    UNION ALL
    SELECT
      "pears" AS fruit,
      1 AS count
    UNION ALL
    SELECT
      "bananas" AS fruit,
      0 AS count
    
  9. Haz clic en Formato.

API

Para crear una vista, primero debes preparar el contenido del archivo SQLX para la solicitud de API.

  1. Crea un archivo local llamado quickstart-source.sqlx y pega el siguiente fragmento de código SQL:

    config {
      type: "view"
    }
    
    SELECT
      "apples" AS fruit,
      2 AS count
    UNION ALL
    SELECT
      "oranges" AS fruit,
      5 AS count
    UNION ALL
    SELECT
      "pears" AS fruit,
      1 AS count
    UNION ALL
    SELECT
      "bananas" AS fruit,
      0 AS count
    
  2. En tu terminal, ejecuta el siguiente comando para codificar el contenido del archivo en una sola cadena continua:

    base64 -w 0 quickstart-source.sqlx
    
  3. Copia la cadena de salida resultante para usarla en el campo VIEW_DEFINITION del cuerpo de la solicitud JSON.

  4. Para crear y definir el archivo de definición de la vista en tu espacio de trabajo, usa el método projects.locations.repositories.workspaces.writeFile.

    Ejecuta la solicitud a la API con la siguiente información:

    • Endpoint: POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile

    Carga útil de JSON (write_view.json):

    {
      "path": "definitions/quickstart-source.sqlx",
      "contents": "VIEW_DEFINITION"
    }
    

    Comando curl:

    curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      -d @write_view.json \
      "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile"
    

    Reemplaza lo siguiente:

    • LOCATION: Es la Google Cloud región de tu repositorio, por ejemplo, europe-west4.
    • PROJECT_ID: Es el identificador único del proyecto deGoogle Cloud en el que se encuentra tu repositorio de Dataform.
    • REPOSITORY_ID: Es el identificador único de tu repositorio de Dataform, por ejemplo, quickstart-repository.
    • VIEW_DEFINITION: Es el contenido del archivo SQLX como una cadena codificada en Base64.
    • WORKSPACE_ID: Es el identificador único de tu espacio de trabajo de desarrollo de Dataform, por ejemplo, feature-branch-1.

Crea una tabla

Una tabla de Dataform es un activo definido en un archivo SQLX que almacena los resultados de consultas transformados en BigQuery como parte de tu flujo de trabajo. Para definir una tabla para tu flujo de trabajo, selecciona una de las siguientes opciones:

Console

  1. En la consola de Google Cloud , ve a la página Dataform de BigQuery.

    Ir a Dataform

  2. Haz clic en quickstart-repository y, luego, en quickstart-workspace.

  3. En el panel Archivos, junto a definitions/, haz clic en el menú Más y, luego, selecciona Crear archivo.

  4. En el campo Agregar una ruta de acceso al archivo, ingresa definitions/quickstart-table.sqlx.

  5. Haz clic en Crear archivo.

  6. En el panel Archivos, expande el directorio definitions/.

  7. Selecciona quickstart-table.sqlx y, luego, ingresa el siguiente tipo de tabla y la instrucción SELECT:

    config {
      type: "table"
    }
    
    SELECT
      fruit,
      SUM(count) as count
    FROM ${ref("quickstart-source")}
    GROUP BY 1
    
  8. Haz clic en Formato.

Después de definir el tipo de tabla, Dataform muestra un error de validación de consulta porque quickstart-source aún no existe en BigQuery. Este error se resuelve cuando ejecutas el flujo de trabajo.

API

Para crear una tabla, primero debes preparar el contenido del archivo SQLX para la solicitud de la API.

  1. Crea un archivo local llamado quickstart-table.sqlx y pega el siguiente fragmento de código SQL:

    config {
      type: "table"
    }
    
    SELECT
      fruit,
      SUM(count) as count
    FROM ${ref("quickstart-source")}
    GROUP BY 1
    
  2. En tu terminal, ejecuta el siguiente comando para codificar el contenido del archivo en una sola cadena continua:

    base64 -w 0 quickstart-table.sqlx
    
  3. Copia la cadena de salida resultante para usarla en el campo TABLE_DEFINITION del cuerpo de la solicitud JSON.

  4. Para definir una tabla en tu espacio de trabajo, usa el método projects.locations.repositories.workspaces.writeFile. Esta única solicitud a la API reemplaza los pasos manuales de crear un archivo SQLX y definir la estructura y las dependencias de la tabla.

    Ejecuta la solicitud a la API con la siguiente información:

    • Endpoint: POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile

    Carga útil de JSON (write_table.json):

    {
      "path": "definitions/quickstart-table.sqlx",
      "contents": "TABLE_DEFINITION"
    }
    

    Comando curl:

    curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      -d @write_table.json \
      "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID:writeFile"
    

    Reemplaza lo siguiente:

    • LOCATION: Es la Google Cloud región de tu repositorio, por ejemplo, europe-west4.
    • PROJECT_ID: Es el identificador único del proyecto deGoogle Cloud en el que se encuentra tu repositorio de Dataform.
    • REPOSITORY_ID: Es el identificador único de tu repositorio de Dataform, por ejemplo, quickstart-repository.
    • TABLE_DEFINITION: Es el contenido del archivo SQLX como una cadena codificada en Base64.
    • WORKSPACE_ID: Es el identificador único de tu espacio de trabajo de desarrollo de Dataform, por ejemplo, feature-branch-1.

Ejecuta el flujo de trabajo en BigQuery

Para ejecutar el flujo de trabajo, selecciona una de las siguientes opciones:

Console

  1. En la consola de Google Cloud , ve a la página Dataform de BigQuery.

    Ir a Dataform

  2. Haz clic en quickstart-repository y, luego, en quickstart-workspace.

  3. Haz clic en Iniciar ejecución.

  4. Haz clic en Todas las acciones.

  5. Haz clic en Iniciar ejecución.

  6. En el diálogo que se abre, haz clic en Permitir para otorgarle permiso a BigQuery Pipelines para acceder a tu Cuenta de Google.

    Dataform usa la configuración predeterminada del repositorio para crear el contenido de tu flujo de trabajo en un conjunto de datos de BigQuery llamado dataform.

Creaste correctamente un flujo de trabajo de Dataform y lo ejecutaste en BigQuery.

API

Para ejecutar tu flujo de trabajo en BigQuery, compila tus archivos SQLX en SQL estándar y, luego, activa una invocación.

  1. Para crear un resultado de compilación basado en tu espacio de trabajo, usa el método projects.locations.repositories.compilationResults.create.

    Ejecuta la solicitud a la API con la siguiente información:

    • Endpoint: POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults

    Comando curl:

    curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      -d '{
        "workspace": "projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/WORKSPACE_ID"
      }' \
      "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults"
    

    Reemplaza lo siguiente:

    • LOCATION: Es la Google Cloud región de tu repositorio, por ejemplo, europe-west4.
    • PROJECT_ID: Es el identificador único del proyecto deGoogle Cloud en el que se encuentra tu repositorio de Dataform.
    • REPOSITORY_ID: Es el identificador único de tu repositorio de Dataform, por ejemplo, quickstart-repository.
    • WORKSPACE_ID: Es el identificador único de tu espacio de trabajo de desarrollo de Dataform, por ejemplo, feature-branch-1.
  2. En la respuesta, anota el ID del resultado de la compilación en el formato /compilationResults/COMPILATION_ID.

  3. Para activar una invocación de flujo de trabajo, usa el método projects.locations.repositories.workflowInvocations.create. Proporciona el ID del resultado de compilación que creaste.

    Ejecuta la solicitud a la API con la siguiente información:

    • Endpoint: POST https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations

    Comando curl:

    curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      -d '{
        "compilationResult": "projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults/COMPILATION_ID"
      }' \
      "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations"
    

    Reemplaza lo siguiente:

    • COMPILATION_ID: Es el identificador único del resultado de la compilación.
    • LOCATION: Es la Google Cloud región de tu repositorio, por ejemplo, europe-west4.
    • PROJECT_ID: Tu Google Cloud ID de proyecto Google Cloud único en el que se encuentra el repositorio de Dataform.
    • REPOSITORY_ID: Es el identificador único de tu repositorio de Dataform, por ejemplo, quickstart-repository.

Creaste correctamente un flujo de trabajo de Dataform y lo ejecutaste en BigQuery.

Ver registros de ejecución en Dataform

Para ver los registros de ejecución, selecciona una de las siguientes opciones:

Console

  1. En la consola de Google Cloud , ve a la página Dataform de BigQuery.

    Ir a Dataform

  2. Haz clic en quickstart-repository y, luego, en quickstart-workspace.

  3. Haz clic en Registros de ejecución del flujo de trabajo.

  4. Para ver los detalles de la ejecución, haz clic en la ejecución más reciente.

API

  1. Para ver un historial de tus ejecuciones, usa el método projects.locations.repositories.workflowInvocations.list.

    Ejecuta la solicitud a la API con la siguiente información:

    • Endpoint: GET https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations
    • Parámetro de consulta: Para asegurarte de que las ejecuciones más recientes aparezcan en la parte superior de los resultados, usa ?orderBy=create_time desc.

    Comando curl:

      curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \
        "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations?orderBy=create_time%20desc"
    

    Reemplaza lo siguiente:

    • LOCATION: Es la Google Cloud región de tu repositorio, por ejemplo, europe-west4.
    • PROJECT_ID: Tu Google Cloud ID de proyecto Google Cloud único en el que se encuentra el repositorio de Dataform.
    • REPOSITORY_ID: Es el identificador único de tu repositorio de Dataform, por ejemplo, quickstart-repository.
  2. Para ver los registros y el estado detallados de una ejecución específica, usa el método projects.locations.repositories.workflowInvocations.query.

    Ejecuta la solicitud a la API con la siguiente información:

    • Endpoint: GET https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations/WORKFLOW_INVOCATION_ID:query

    Comando curl:

      curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \
        "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations/WORKFLOW_INVOCATION_ID:query"
    

    Reemplaza lo siguiente:

    • LOCATION: Es la Google Cloud región de tu repositorio, por ejemplo, europe-west4.
    • PROJECT_ID: Tu Google Cloud ID de proyecto Google Cloud único en el que se encuentra el repositorio de Dataform.
    • REPOSITORY_ID: Es el identificador único de tu repositorio de Dataform, por ejemplo, quickstart-repository.
    • WORKFLOW_INVOCATION_ID: Es el identificador único de una ejecución de flujo de trabajo específica. Puedes obtener este identificador de los resultados de una solicitud workflowInvocations.list o del campo name de una respuesta workflowInvocations.create.

Realiza una limpieza

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

Borra el conjunto de datos creado en BigQuery

Para evitar que se generen cargos por los recursos de BigQuery, borra el conjunto de datos llamado dataform.

  1. En la consola de Google Cloud , ve a la página BigQuery.

    Ir a BigQuery

  2. En el panel Explorador, expande tu proyecto y selecciona dataform.

  3. Haz clic en el menú Acciones y, luego, selecciona Borrar.

  4. En el cuadro de diálogo Borrar conjunto de datos, ingresa delete en el campo y, luego, haz clic en Borrar.

Borra el lugar de trabajo de desarrollo de Dataform

La creación de lugares de trabajo de desarrollo de Dataform no genera costos, pero para borrar el lugar de trabajo de desarrollo, sigue estos pasos:

  1. En la consola de Google Cloud , ve a la página Dataform de BigQuery.

    Ir a Dataform

  2. Haz clic en quickstart-repository.

  3. En la pestaña Lugares de trabajo de desarrollo, haz clic en el menú Más de quickstart-workspace y, luego, selecciona Borrar.

  4. Para confirmar la acción, haz clic en Borrar.

Borra el repositorio de Dataform

La creación de repositorios de Dataform no genera costos, pero para borrar el repositorio, sigue estos pasos:

  1. En la consola de Google Cloud , ve a la página Dataform de BigQuery.

    Ir a Dataform

  2. En quickstart-repository, haz clic en el menú Más y, luego, selecciona Borrar.

  3. En la ventana Borrar repositorio, ingresa el nombre del repositorio para confirmar su eliminación.

  4. Para confirmar la acción, haz clic en Borrar.

¿Qué sigue?