Antes de usar Knowledge Catalog (anteriormente, Dataplex Universal Catalog), debes habilitar las APIs necesarias en tu proyecto de Google Cloud . En este documento, se muestra cómo habilitar la API de Knowledge Catalog y otros servicios requeridos.
Como medida de seguridad, una organización puede controlar quién tiene permiso para habilitar APIs. En algunos casos, habilitar las APIs inicia la facturación, por lo que las organizaciones pueden restringir el acceso para controlar los costos. Para obtener información sobre el Service Usage enGoogle Cloud, consulta Cómo habilitar e inhabilitar servicios.
Antes de comenzar
Para habilitar o inhabilitar la API de Dataplex, necesitas el rol de propietario o editor. Para obtener más información sobre los roles y los permisos, consulta Control de acceso con IAM.
Habilita Knowledge Catalog
Puedes usar un proyecto existente con Knowledge Catalog o crear uno nuevo. Te recomendamos que crees un proyecto nuevo. Si usas un proyecto Google Cloud nuevo o un proyecto en el que la API de BigQuery está habilitada, la API de Dataplex se habilita de forma predeterminada. Sin embargo, aún debes habilitar la API de Dataproc y la API de Dataproc Metastore.
Para mantener los recursos creados por el lago dentro de tu proyecto, separados entre sí, crea un proyecto por instancia del lago.
Para crear un proyecto y habilitar Knowledge Catalog, sigue estos pasos:
- En la consola de Google Cloud , selecciona o crea un proyecto.
- Asegúrate de tener habilitada la facturación para tu proyecto.
-
Habilita las APIs de Dataplex, Managed Service for Apache Spark y Dataproc Metastore.
Roles necesarios para habilitar las APIs
Para habilitar las APIs, necesitas el rol de IAM de administrador de Service Usage (
roles/serviceusage.serviceUsageAdmin), que contiene el permisoserviceusage.services.enable. Obtén más información para otorgar roles.
Inhabilita Knowledge Catalog
Si usas Knowledge Catalog en un proyecto que también usa BigQuery, ten en cuenta los efectos en el comportamiento de BigQuery cuando inhabilites Knowledge Catalog.
Para evitar cargos adicionales, completa los siguientes pasos antes de inhabilitar Knowledge Catalog:
En la consola de Google Cloud , borra cada instancia del lake en tu proyecto. Para borrar un lake, primero debes borrar los recursos y las zonas individuales. Para obtener más información, consulta Cómo borrar un lago.
En la consola de Google Cloud , borra todos los grupos de entradas personalizados de tu proyecto. Si borras un grupo de entradas, se quitarán todas las entradas que pertenezcan a él. Para obtener más información, consulta Borra un grupo de entradas.
Selecciona el proyecto en el que quieres inhabilitar la API de Dataplex.
Ve a la página APIs y servicios habilitados.
Haz clic en Cloud Dataplex API.
Haz clic en Inhabilitar API. Confirma cuando se te solicite.
Para inhabilitar las siguientes APIs, repite los pasos:
- API de Data Lineage (si está habilitada)
¿Qué sigue?
- Obtén más información para buscar recursos.
- Obtén más información para medir la calidad de los datos.
- Obtén más información sobre los conceptos de administración del catálogo.
- Sigue una guía de inicio rápido: Realiza un seguimiento del linaje de datos de una tabla de BigQuery.