Antes de poder usar Dataplex Universal Catalog, debes habilitar las APIs necesarias en tu Google Cloud proyecto. En este documento, se muestra cómo habilitar la API de Dataplex Universal Catalog y otros servicios requeridos.
Como medida de seguridad, una organización puede controlar quién tiene permiso para habilitar las APIs. En algunos casos, habilitar las APIs inicia la facturación, por lo que las organizaciones pueden restringir el acceso para controlar los costos. Para obtener información sobre el Service Usage en Google Cloud, consulta Cómo habilitar e inhabilitar servicios.
Antes de comenzar
Para habilitar y inhabilitar la API de Dataplex, necesitas el rol de propietario editor. Para obtener más información sobre las funciones y los permisos, consulta Control de acceso con IAM.
Habilita Dataplex Universal Catalog
Puedes usar un proyecto existente con Dataplex Universal Catalog o crear uno nuevo. Te recomendamos que crees un proyecto nuevo. Si usas un proyecto nuevo Google Cloud o un proyecto en el que está habilitada la API de BigQuery, la API de Dataplex está habilitada de forma predeterminada. Sin embargo, aún debes habilitar la API de Dataproc y la API de Dataproc Metastore.
Para mantener los recursos creados por el lake dentro de tu proyecto, separados entre sí, crea un proyecto por instancia de lake.
Para crear un proyecto y habilitar Dataplex Universal Catalog, sigue estos pasos:
- En la Google Cloud consola de, selecciona o crea un proyecto.
- Asegúrate de tener habilitada la facturación para tu proyecto.
-
Habilita las APIs de Dataplex, Dataproc y Dataproc Metastore.
Roles necesarios para habilitar las APIs
Para habilitar las APIs, necesitas el rol de IAM de administrador de Service Usage (
roles/serviceusage.serviceUsageAdmin), que contiene el permisoserviceusage.services.enable. Obtén más información para otorgar roles.
Inhabilita Dataplex Universal Catalog
Si usas Dataplex Universal Catalog en un proyecto que también usa BigQuery, ten en cuenta los efectos en el comportamiento de BigQuery cuando inhabilitas Dataplex Universal Catalog.
Para evitar cargos adicionales, completa los siguientes pasos antes de inhabilitar Dataplex Universal Catalog:
En la Google Cloud consola de, borra cada instancia de lake de tu proyecto. Para borrar un lake, primero debes borrar los recursos y las zonas individuales. Para obtener más información, consulta Borra un lake.
En la Google Cloud consola de, borra todos los grupos de entradas personalizadas de tu proyecto. Cuando borras un grupo de entradas, se quitan todas las entradas que pertenecen a él. Para obtener más información, consulta Borra un grupo de entradas.
Selecciona el proyecto para inhabilitar la API de Dataplex.
Ve a la página APIs y servicios habilitados.
Haz clic en API de Cloud Dataplex.
Haz clic en Inhabilitar API. Confirma cuando se te solicite.
Para inhabilitar las siguientes APIs, repite los pasos:
- API de Data Lineage (si está habilitada)
¿Qué sigue?
- Obtén más información para buscar recursos.
- Obtén información para medir la calidad de los datos.
- Obtén información sobre los conceptos de administración de catálogos.
- Sigue una guía de inicio rápido: Realiza un seguimiento del linaje de datos de una tabla de BigQuery.