Programar ejecuciones de producción
En esta guía de inicio rápido se explican los siguientes pasos para programar ejecuciones de producción en Dataform:
- Crea un repositorio de Dataform.
- Concede acceso a Dataform a BigQuery.
Crea una configuración de lanzamiento para configurar el entorno de producción.
Crea una configuración de lanzamiento
production
y define la frecuencia con la que se crean los resultados de la compilaciónproduction
.Crea una configuración de flujo de trabajo para programar ejecuciones en el entorno de producción.
Crea una
production
configuración de flujo de trabajo, selecciona laproduction
configuración de lanzamiento y define una programación para ejecutar losproduction
resultados de compilación.
Antes de empezar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Administrador de Dataform (
roles/dataform.admin
) en repositorios -
Editor de Dataform (
roles/dataform.editor
) en espacios de trabajo e invocaciones de flujo de trabajo En la Google Cloud consola, ve a la página Dataform.
Haz clic en
Crear repositorio.En la página Crear repositorio, haz lo siguiente:
En el campo Repository ID (ID de repositorio), introduce
quickstart-production
.En la lista Región, selecciona
europe-west4
.Haz clic en Crear.
Haz clic en Listo.
- Editor de datos de BigQuery en los proyectos a los que Dataform necesita acceso de lectura y escritura. Normalmente, incluyen el proyecto que aloja tu repositorio de Dataform.
- Lector de datos de BigQuery en los proyectos a los que Dataform necesita acceso de solo lectura.
- Usuario de tareas de BigQuery en el proyecto que aloja tu repositorio de Dataform.
En la consola de Google Cloud , ve a la página Gestión de identidades y accesos.
Haz clic en Añadir.
En el campo Nuevos principales, introduce el ID de agente de servicio o de cuenta de servicio de Dataform.
En la lista Selecciona un rol, elige el rol Usuario de tareas de BigQuery.
Haz clic en Añadir otro rol y, en la lista Seleccionar un rol, selecciona el rol Editor de datos de BigQuery.
Haz clic en Añadir otro rol y, en la lista Seleccionar un rol, selecciona el rol Lector de datos de BigQuery.
Haz clic en Guardar.
En la Google Cloud consola, ve a la página Dataform.
Haz clic en
quickstart-production
.Haga clic en Configuraciones de lanzamiento y, a continuación, en Nueva configuración de lanzamiento.
En el panel Crear configuración de lanzamiento, configura los siguientes ajustes:
En el campo Release ID (ID de lanzamiento), introduce
production
.En el campo Git commitish, deja el valor predeterminado
main
.En el menú Frecuencia, selecciona Personalizada.
En el campo Programación personalizada, introduce
0 16 * * *
.En el menú Zona horaria, selecciona una zona horaria UTC+1, por ejemplo, Hora del meridiano de Greenwich (GMT).
Todos los días a las 16:00 (UTC+1), Dataform compilará el
quickstart-production
repositorio y aplicará los ajustes de compilación configurados en esta versión para crearproduction
resultados de compilación.Haz clic en Crear.
En la Google Cloud consola, ve a la página Dataform.
Haz clic en
quickstart-production
.Haz clic en Configuraciones de flujo de trabajo y, a continuación, en Nueva configuración de flujo de trabajo.
En el panel Crear configuración de flujo de trabajo, en el campo ID de configuración, introduce
production
.En el menú Configuración de la versión, selecciona
production
.En el campo Frequency (Frecuencia), introduce
0 17 * * *
.En el menú Zona horaria, selecciona una zona horaria UTC+1, por ejemplo, Hora del meridiano de Greenwich (GMT).
Todos los días a las 17:00 (UTC+1), Dataform ejecuta el último
production
resultado de compilación del repositorioquickstart-production
.Para asegurarte de que Dataform ejecuta el resultado de compilación más reciente en la configuración de lanzamiento correspondiente, deja un intervalo de al menos 1 hora entre el momento en que se crea el resultado de compilación y el momento en que se programa la ejecución.
Haz clic en Todas las acciones.
Dataform ejecuta todas las acciones del flujo de trabajo en el
production
resultado de la compilación.Haz clic en Crear.
En la Google Cloud consola, ve a la página Dataform.
Haz clic en
quickstart-production
.Haz clic en Configuraciones de lanzamiento.
Haz clic en
production
.En la Google Cloud consola, ve a la página Dataform.
Haz clic en
quickstart-production
.Haz clic en Configuraciones de flujo de trabajo.
En la Google Cloud consola, ve a la página BigQuery.
En el panel Explorador, expande tu proyecto y selecciona
dataform_production
.Haz clic en el menú
Acciones y, a continuación, selecciona Eliminar.En el cuadro de diálogo Eliminar conjunto de datos, escribe eliminar y, a continuación, haz clic en Eliminar.
En la Google Cloud consola, ve a la página Dataform.
Haz clic en
quickstart-production
.Haz clic en Configuraciones de lanzamiento.
En la configuración de la versión
production
, haz clic en el menú Más y, a continuación, en Eliminar.En el cuadro de diálogo Eliminar configuración de lanzamiento, haz clic en Eliminar.
En la Google Cloud consola, ve a la página Dataform.
Haz clic en
quickstart-production
.Haz clic en Configuraciones de flujo de trabajo.
En la configuración del flujo de trabajo
production
, haz clic en el menú Más y, a continuación, en Eliminar.En el cuadro de diálogo Eliminar configuración de lanzamiento, haz clic en Eliminar.
En la Google Cloud consola, ve a la página Dataform.
En
quickstart-production
, haz clic en el menú Más y, a continuación, selecciona Eliminar.En la ventana Eliminar repositorio, introduce el nombre del repositorio para confirmar la eliminación.
Para confirmar la acción, haz clic en Eliminar.
Para obtener más información sobre el ciclo de vida del código en Dataform, consulta el artículo Introducción al ciclo de vida del código en Dataform.
Para obtener más información sobre las prácticas recomendadas para el ciclo de vida de los flujos de trabajo en Dataform, consulte Prácticas recomendadas para el ciclo de vida de los flujos de trabajo.
Para obtener más información sobre las configuraciones de lanzamiento en Dataform, consulta Crear una configuración de lanzamiento.
Para obtener más información sobre las configuraciones de flujo de trabajo en Dataform, consulta Programar ejecuciones con configuraciones de flujo de trabajo.
Roles obligatorios
Para obtener los permisos que necesitas para realizar todas las tareas de este tutorial, pide a tu administrador que te asigne los siguientes roles de IAM:
Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar acceso a proyectos, carpetas y organizaciones.
También puedes conseguir los permisos necesarios a través de roles personalizados u otros roles predefinidos.
Crear un repositorio de Dataform
Conceder acceso de Dataform a BigQuery
Para ejecutar flujos de trabajo en BigQuery, el agente de servicio de Dataform o la cuenta de servicio personalizada deben tener los siguientes roles obligatorios:
Para conceder estos roles, sigue estos pasos:
Crear una configuración de lanzamiento
Para crear resultados de compilación de producción del repositorio quickstart-production
, sigue estos pasos:
La configuración de lanzamiento production
crea un resultado de compilación de todo el repositorio quickstart-production
todos los días a las 16:00 (UTC+1).
Crear una configuración de flujo de trabajo
Para programar la ejecución de production
tablas, sigue estos pasos:
La configuración del flujo de trabajo production
ejecuta el resultado de la compilación más reciente creada por la configuración de lanzamiento production
todos los días a las 16:00 (UTC+1).
Ver resultados de compilación anteriores de production
Para ver los resultados de compilación programada anteriores de production
, sigue estos pasos:
Ver ejecuciones anteriores de flujos de trabajo de production
Para ver las ejecuciones anteriores de un flujo de trabajo de production
, sigue estos pasos:
Limpieza
Para evitar que se apliquen cargos en tu cuenta de Google Cloud por los recursos utilizados en esta página, sigue estos pasos.
Eliminar el conjunto de datos creado en BigQuery
Para evitar que se te cobren los recursos de BigQuery, sigue estos pasos para eliminar el conjunto de datos llamado dataform_production
:
Eliminar la configuración de lanzamiento de Dataform
La creación de configuraciones de lanzamiento de Dataform no conlleva ningún coste. Sin embargo, si quieres eliminar la configuración de la versión production
, sigue estos pasos:
Eliminar la configuración del flujo de trabajo de Dataform
Para evitar que se te cobren los recursos de BigQuery, sigue estos pasos para eliminar la configuración del flujo de trabajo de Dataform production
:
Eliminar el repositorio de Dataform
La creación de repositorios de Dataform no conlleva ningún coste. Sin embargo, si quieres eliminar un repositorio y todo su contenido, sigue estos pasos: