Knowledge Catalog (anteriormente, Dataplex Universal Catalog) reemplaza a Data Catalog y proporciona una administración de metadatos más compleja, funciones avanzadas de administración de datos, una búsqueda de datos más potente, un control de acceso menos complejo y una API unificada para facilitar el desarrollo. En este documento, se muestra cómo migrar tu contenido y uso de Data Catalog a Knowledge Catalog.
Si es la primera vez que usas el catálogo, comienza con Knowledge Catalog configurándolo como tu experiencia de catálogo predeterminada.
Knowledge Catalog tiene una API y una interfaz web unificadas. La transición a Knowledge Catalog permite que tus cargas de trabajo y usuarios existentes y futuros se beneficien de sus funciones y capacidades mejoradas. Para obtener más información, consulta Acerca de la administración de metadatos en Knowledge Catalog.
Para comparar Knowledge Catalog y Data Catalog, consulta Comparación entre Knowledge Catalog y Data Catalog.
Antes de comenzar
Antes de comenzar la transición, revisa las funciones de administración de metadatos que no se admiten en Knowledge Catalog.
Descripción general de la transición
La página Administrar la transición a Knowledge Catalog en la consola de Google Cloud proporciona un único punto de acceso para administrar la transición.
En esta sección, se describen las distintas situaciones de transición y se explica el proceso de transición para cada una de ellas.
Si no tienes metadatos personalizados en Data Catalog o si nunca usaste Data Catalog
Si usas Data Catalog y no tienes metadatos personalizados, como etiquetas, plantillas de etiquetas, entradas personalizadas o grupos de entradas, o si nunca usaste Data Catalog, completa la transición configurando Knowledge Catalog como la experiencia de IU de catálogo predeterminada.
Si tienes metadatos personalizados de Data Catalog o cargas de trabajo programáticas
Si usas Data Catalog con metadatos personalizados (como etiquetas, plantillas de etiquetas, entradas personalizadas o grupos de entradas), Knowledge Catalog puede importar automáticamente estos metadatos personalizados como read-only. Para habilitar esta capacidad, se requieren cambios en la configuración, como se describe en la fase preparatoria.
La segunda fase es la fase de actualización, en la que el estado activo (read-write) de tus metadatos personalizados se transfiere a Knowledge Catalog. Durante esta fase, también debes actualizar cualquier carga de trabajo programática (como la API, las bibliotecas cliente, los módulos de Terraform y los comandos de Google Cloud CLI) para que interactúe con Knowledge Catalog.
A continuación, se proporcionan más detalles sobre cada fase del proceso de transición:
Fase preparatoria: Realiza las tareas de configuración necesarias para que el contenido de Data Catalog esté disponible de forma simultánea en Knowledge Catalog como
read-only. Durante esta fase, Data Catalog sigue siendo la fuente autorizada del contenido de tus metadatos.La fase preparatoria incluye las siguientes tareas:
- Actualiza las plantillas de etiquetas privadas de Data Catalog a públicas.
- Configura los permisos de IAM de Knowledge Catalog para tus metadatos personalizados.
Para obtener más información, consulta Fase preparatoria.
Fase de actualización: Transfiere el uso del catálogo y el estado activo (
read-write) de tus metadatos personalizados a Knowledge Catalog.La fase de actualización incluye las siguientes tareas:
- Establece la experiencia de IU de catálogo predeterminada en Knowledge Catalog.
- Actualiza los metadatos personalizados de Data Catalog a Knowledge Catalog.
- Actualizar cargas de trabajo programáticas
Cuando completes la fase de actualización, Knowledge Catalog se convertirá en la fuente autorizada de todos tus metadatos y no necesitarás usar Data Catalog.
Para obtener más información, consulta Fase de actualización.
Roles obligatorios
Para obtener los permisos que necesitas para realizar la transición de Data Catalog a Knowledge Catalog, otorga los siguientes roles de IAM en el recurso:
Actualiza las plantillas de etiquetas privadas a públicas: Propietario de TagTemplate de Data Catalog (
roles/datacatalog.tagTemplateOwner)Este rol predefinido contiene el permiso
datacatalog.tagTemplates.update, que se requiere para actualizar las plantillas de etiquetas privadas a públicas.Establece la experiencia de IU de Catalog predeterminada en Knowledge Catalog: Administrador de la configuración de migración de DataCatalog (
roles/datacatalog.migrationConfigAdmin)Este rol predefinido contiene el permiso
datacatalog.migrationConfig.set, que se requiere para establecer la experiencia predeterminada de la IU del catálogo.Actualizar las plantillas de etiquetas públicas de Data Catalog a Knowledge Catalog: Propietario de TagTemplate de Data Catalog (
roles/datacatalog.tagTemplateOwner)Este rol predefinido contiene el permiso
datacatalog.tagTemplates.update, que se requiere para actualizar las plantillas de etiquetas públicas.Actualiza los grupos de entradas de Data Catalog a Knowledge Catalog: Propietario de EntryGroup de DataCatalog (
roles/datacatalog.entryGroupOwner)Este rol predefinido contiene el permiso
datacatalog.entryGroups.update, que se requiere para actualizar grupos de entradas.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios con roles personalizados o con otros roles predefinidos.
Fase preparatoria
En esta fase, se realizan tareas para que el contenido de los metadatos de Data Catalog esté disponible de forma simultánea en Knowledge Catalog, en el modo read-only.
Estos son los puntos clave que debes recordar durante la fase preparatoria:
- Data Catalog sigue siendo la fuente autorizada de tus metadatos personalizados.
- Es posible que la búsqueda de Knowledge Catalog no incluya todas las plantillas de etiquetas públicas y etiquetas de Data Catalog hasta que completes la fase preparatoria.
Más información sobre la disponibilidad simultánea de los metadatos de Data Catalog en Knowledge Catalog
Los grupos de entradas, las entradas, las etiquetas y las plantillas de etiquetas públicas personalizadas de Data Catalog están disponibles automáticamente en Knowledge Catalog como recursos de read-only.
En la siguiente tabla, se muestra la asignación entre los recursos de Data Catalog y Knowledge Catalog cuando los recursos de Data Catalog están disponibles de forma simultánea en Knowledge Catalog:
| Recurso de Data Catalog | Recurso de Knowledge Catalog correspondiente | Descripción |
|---|---|---|
| Plantilla de etiqueta | Tipo de aspecto (global) | Las plantillas de etiquetas en Data Catalog son recursos regionales. Su contenido está disponible simultáneamente como tipos de aspectos globales en Knowledge Catalog. Esto se hace para conservar las referencias entre regiones entre las etiquetas y las plantillas de etiquetas. Las definiciones de los tipos de aspectos globales se replican en todas las regiones de Google Cloud . Los conceptos estándares, como |
| Etiqueta | Aspecto opcional | Las etiquetas están disponibles de forma simultánea como aspectos opcionales en Knowledge Catalog. Para obtener más información, consulta Categorías de aspectos. |
| Grupo de entradas | Grupo de entradas | Los grupos de entradas para las entradas del sistema se establecen por proyecto y por región en Knowledge Catalog. Los grupos de entradas creados en Data Catalog están disponibles de forma simultánea en Knowledge Catalog. |
| Entrada personalizada | Entrada personalizada | Todas las entradas personalizadas de Data Catalog están disponibles de forma simultánea como entradas de GenericEntryType en Knowledge Catalog.
Para obtener más información, consulta Categorías de tipos de entrada.
|
| Entrada del sistema (Google Cloud) | Aspecto obligatorio de la entrada del sistema | Los metadatos que describen las entradas del sistema, como Schema para las tablas de BigQuery, se capturan en los aspectos obligatorios de los tipos de aspectos definidos por el sistema.
|
Actualiza las plantillas de etiquetas privadas de Data Catalog a públicas
Knowledge Catalog no admite el concepto de aspectos privados (equivalentes a las etiquetas privadas). Por lo tanto, las etiquetas y plantillas de etiquetas privadas no están disponibles de forma simultánea en Knowledge Catalog. Para propagar etiquetas y plantillas de etiquetas privadas en Knowledge Catalog, debes actualizarlas a públicas.
Antes de continuar, revisa la estructura de las plantillas de etiquetas privadas para verificar que su estructura y metadatos sean coherentes con la visibilidad de las etiquetas públicas.
Para actualizar las plantillas de etiquetas privadas y las etiquetas a públicas, sigue estos pasos:
Console
En la consola de Google Cloud , ve a la página Plantillas de etiquetas.
Haz clic en Administrar la transición a Knowledge Catalog.
Haz clic en la pestaña Plantillas de etiquetas privadas.
Haz clic en Administrar plantillas de etiquetas.
En la página Plantillas de etiquetas, haz clic en la plantilla de etiqueta privada que deseas actualizar.
En la página Detalles de la plantilla, haz clic en Editar.
En la sección Visibilidad, selecciona Público.
Haz clic en Actualizar.
REST
Para actualizar las plantillas de etiquetas privadas a públicas, usa el método tagTemplates.patch.
Configura los permisos de IAM de Knowledge Catalog para tus metadatos personalizados
Los tipos de aspectos y los grupos de entradas personalizados de Knowledge Catalog que representan plantillas de etiquetas y grupos de entradas de Data Catalog no heredan los permisos de IAM originales de Data Catalog. Los permisos de IAM específicos que se requieren también difieren entre Knowledge Catalog y Data Catalog.
Por ejemplo, si deseas crear aspectos con un tipo de aspecto propagado (que representa una plantilla de etiquetas de Data Catalog), debes configurar los permisos de IAM necesarios para ese tipo de aspecto. Del mismo modo, cuando ingieres metadatos personalizados, para crear entradas personalizadas dentro de un grupo de entradas personalizadas propagado, debes configurar los permisos de IAM necesarios para ese grupo de entradas.
Si usas roles de IAM de Data Catalog para administrar el acceso en Data Catalog a nivel del proyecto o superior, los permisos necesarios de Knowledge Catalog se incluyen automáticamente. Sin embargo, si usas roles personalizados o asignas roles de IAM directamente a recursos específicos, debes configurar manualmente los permisos de Knowledge Catalog para esos aspectos específicos y grupos de entradas personalizados.
Para obtener más información sobre cómo los permisos de IAM en Data Catalog se corresponden con los de Knowledge Catalog, consulta Asignación de permisos de IAM entre Data Catalog y Knowledge Catalog.
Para configurar los permisos de IAM necesarios de Knowledge Catalog para los tipos de aspectos y los grupos de entradas personalizados, sigue estos pasos:
Console
En la consola de Google Cloud , ve a la página Plantillas de etiquetas.
Haz clic en Administrar la transición a Knowledge Catalog.
Haz clic en la pestaña Permisos de IAM de Dataplex.
Para configurar los permisos de IAM de Knowledge Catalog para los tipos de aspectos, haz clic en Tipos de aspectos y plantillas de etiquetas.
En la plantilla de etiqueta propagada desde Data Catalog, haz clic en > Permisos.
Haz clic en Agregar principales.
Agrega una principal nueva y asígnale los roles requeridos.
Haz clic en Guardar.
Para configurar los permisos de IAM de Knowledge Catalog para los grupos de entradas, haz clic en Entry groups.
En el grupo de entradas propagado desde Data Catalog, haz clic en > Permisos.
Haz clic en Agregar principales.
Agrega una principal nueva y asígnale los roles requeridos.
Haz clic en Guardar.
REST
Para configurar los permisos de IAM de Knowledge Catalog para los tipos de aspectos, usa el método aspectTypes.setIamPolicy.
Para configurar los permisos de IAM de Knowledge Catalog para los grupos de entradas, usa el método entryGroups.setIamPolicy.
Fase de actualización
En esta fase, se realizan tareas para transferir el estado activo (read-write) de tus metadatos personalizados de Data Catalog a Knowledge Catalog.
Estos son los puntos clave que debes recordar durante la fase de actualización:
- Puedes descubrir y leer los metadatos de Data Catalog y Knowledge Catalog en Knowledge Catalog.
- Para actualizar los metadatos en la consola de Google Cloud , se te redireccionará a su fuente. Por ejemplo, si actualizas las plantillas de etiquetas de Data Catalog, se te redireccionará a la página de plantillas de etiquetas en Data Catalog.
Establecer la experiencia de IU de catálogo predeterminada en Knowledge Catalog
Si estableces la experiencia de IU de catálogo predeterminada en Knowledge Catalog, ocurrirá lo siguiente:
La interfaz web te recomienda crear recursos nuevos en Knowledge Catalog. Por ejemplo, se establece de forma predeterminada en Create Aspect Types en lugar de Create Tag Templates, y en Create Entry Group (Knowledge Catalog) en lugar de Create Entry Group (Data Catalog).
Por lo general, establecer la experiencia de IU de catálogo predeterminada en Knowledge Catalog es una operación unidireccional. Sin embargo, Knowledge Catalog te permite revertir cambios en casos excepcionales, por ejemplo, cuando quieres volver a cambiar la experiencia de IU de Catalog predeterminada a Data Catalog. Si reviertes los cambios, no podrás acceder a ningún contenido creado en Knowledge Catalog en la interfaz web de Data Catalog.
Para establecer la experiencia de IU de catálogo predeterminada en Knowledge Catalog, sigue estos pasos:
Console
En la consola de Google Cloud , ve a la página Plantillas de etiquetas.
Haz clic en Administrar la transición a Knowledge Catalog.
Haz clic en la pestaña Experiencia de IU de catálogo predeterminada.
Haz clic en Establecer la experiencia de IU de catálogo predeterminada en Knowledge Catalog.
REST
Para establecer la experiencia de IU de catálogo predeterminada en Knowledge Catalog, usa el método setConfig.
Actualiza los metadatos personalizados de Data Catalog a Knowledge Catalog
Puedes actualizar las plantillas de etiquetas públicas y los grupos de entradas personalizados de Data Catalog a Knowledge Catalog. Asegúrate de actualizar cada plantilla de etiquetas y grupo de entrada personalizado por separado.
A continuación, se resume el proceso de actualización:
Efecto
- Transfiere el estado activo de los recursos de Data Catalog a Knowledge Catalog. Después de la actualización, debes usar Knowledge Catalog para modificar el recurso o acceder a su estado actual.
Cambios en el contenido y el flujo de datos
- Marca el recurso como
read-onlyen Data Catalog. - Marca el recurso como
read-writeen Knowledge Catalog. - Detiene la disponibilidad simultánea de este recurso.
- Marca el recurso como
Dependencias
- Si actualizas una plantilla de etiquetas, también se actualizarán todas las etiquetas que usen esa plantilla.
- Cuando se actualizan grupos de entradas, también se actualizan todas las entradas que contienen.
- La actualización de entradas no afecta el estado de actualización de sus etiquetas y plantillas de etiquetas respectivas.
Antes de la actualización, para modificar el contexto comercial de una entrada (por ejemplo, overview, contacts), puedes usar la API de Data Catalog y la API de Dataplex. Después de la actualización, solo debes usar la API de Dataplex.
A continuación, se describen las operaciones permitidas para una entrada personalizada de Data Catalog que está etiquetada, según el estado de actualización del grupo de entradas personalizado y la plantilla de etiquetas relacionados:
- Cuando una plantilla de etiqueta está activa en Data Catalog, puedes usarla para crear etiquetas. Después de actualizar la plantilla de etiqueta a Knowledge Catalog, no podrás usarla para crear etiquetas en Data Catalog.
- Puedes crear aspectos con tipos de aspectos que se propagan desde las plantillas de etiquetas de Data Catalog solo después de actualizar las plantillas de etiquetas.
Para actualizar las plantillas de etiquetas y los grupos de entradas personalizados de Data Catalog a Knowledge Catalog, sigue estos pasos:
Console
En la consola de Google Cloud , ve a la página Plantillas de etiquetas.
Haz clic en Administrar la transición a Knowledge Catalog.
Haz clic en la pestaña Actualizar a Knowledge Catalog.
Para actualizar las plantillas de etiquetas de Data Catalog a Knowledge Catalog, haz clic en Ver tipos de aspectos y plantillas de etiquetas.
Selecciona las plantillas de etiquetas que deseas actualizar.
Haz clic en Actualizar.
En el cuadro de diálogo Confirmación, haz clic en Confirmar.
Para actualizar los grupos de entradas personalizadas de Data Catalog a Knowledge Catalog, haz clic en Ver grupos de entradas.
Selecciona los grupos de entradas que deseas actualizar.
Haz clic en Actualizar.
En el cuadro de diálogo Confirmación, haz clic en Confirmar.
REST
Para actualizar las plantillas de etiquetas y los grupos de entradas personalizados de Data Catalog a Knowledge Catalog, usa el método tagTemplates.patch.
Cuando completes la fase de actualización, Knowledge Catalog se convertirá en la fuente autorizada de todos tus metadatos, y no necesitarás usar Data Catalog.
Actualiza las cargas de trabajo programáticas
Knowledge Catalog incluye una nueva API, bibliotecas cliente, módulos de Terraform y comandos de Google Cloud CLI. Por lo tanto, debes actualizar cualquier carga de trabajo existente con uso programático de Data Catalog a Knowledge Catalog. Consulta las muestras de código de Knowledge Catalog.
Asegúrate de alinear la actualización de las cargas de trabajo programáticas con la actualización de los recursos dependientes, como las plantillas de etiquetas y los grupos de entradas personalizados. Esto es necesario porque la actualización transfiere el estado activo (read-write) de un recurso de Data Catalog a Knowledge Catalog.
A continuación, se muestra un ejemplo de la secuencia de actualización de las cargas de trabajo programáticas para interactuar con Knowledge Catalog, coordinada con la actualización de los recursos dependientes:
Si tus cargas de trabajo pueden tolerar la coherencia eventual, mueve las operaciones de
readde las cargas de trabajo a Knowledge Catalog.Transfiere las cargas de trabajo que realizan operaciones de etiquetado
writea Knowledge Catalog, coordinado con la actualización de sus plantillas de etiquetas correspondientes.Mueve las cargas de trabajo que realizan operaciones de
writede transferencia personalizadas a Knowledge Catalog, en coordinación con la actualización de los respectivos grupos de entradas personalizadas.
Si necesitas desacoplar las cargas de trabajo de actualización y la actualización de los recursos correspondientes, considera implementar lógica dentro de las cargas de trabajo para enrutar read-write a Data Catalog o Knowledge Catalog según el estado de actualización del recurso. Por lo tanto, las cargas de trabajo operarán independientemente del estado de actualización del recurso relacionado.
¿Qué sigue?
- Obtén más información sobre la administración de metadatos en Knowledge Catalog.
- Obtén más información para buscar recursos en Knowledge Catalog.
- Obtén más información para administrar aspectos y enriquecer metadatos.
- Obtén más información para administrar entradas y transferir fuentes personalizadas.
- Consulta la referencia de la API de Dataplex.