Cómo ver las relaciones de datos en Knowledge Catalog

Knowledge Catalog descubre vínculos potenciales entre los recursos de datos, lo que te ayuda a descubrir los datos relacionados y comprender la naturaleza de la relación.

Antes de comenzar

Antes de ver las relaciones entre los recursos de datos, asegúrate de que se te hayan otorgado los roles necesarios y de que hayas habilitado la API necesaria.

Roles obligatorios

Para obtener los permisos que necesitas para ver las relaciones entre los activos de datos, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Habilita las APIs

Para usar las relaciones de datos, habilita las siguientes APIs en tu proyecto: API de Dataplex y API de BigQuery.

Roles necesarios para habilitar las APIs

Para habilitar las APIs, necesitas el rol de IAM de administrador de Service Usage (roles/serviceusage.serviceUsageAdmin), que contiene el permiso serviceusage.services.enable. Obtén más información para otorgar roles.

Habilitar las API

Acerca de las relaciones de datos

Las relaciones de datos ilustran cómo se conectan los activos de datos. Por ejemplo, si encuentras una tabla con datos de clientes, sus relaciones pueden revelar tablas relacionadas que enumeran pedidos o tickets de asistencia. Además, las relaciones actúan como una guía estructural, ya que proporcionan contexto esencial a los modelos de lenguaje grandes. Como resultado, la IA genera respuestas más precisas y formula consultas exactas para recuperar información específica.

Knowledge Catalog descubre y almacena automáticamente las relaciones comunes entre los recursos de datos. Los datos de relaciones provienen de varias fuentes, como las siguientes:

  • Registros históricos de consultas de Knowledge Catalog que analizan continuamente el historial de consultas para detectar posibles patrones de JOIN entre las tablas.
  • Estadísticas de datos sugiere relaciones de datos a pedido analizando los atributos del esquema y las superposiciones de datos con modelos de lenguaje grandes.

Recursos de datos admitidos

Puedes ver las relaciones de datos de las tablas y vistas de BigQuery.

Cómo ver las relaciones entre los datos

Para ver las relaciones de datos de las tablas y vistas de BigQuery, usa la consola de Google Cloud o la API de Knowledge Catalog.

Console

Para ver las relaciones de datos de una tabla en BigQuery, haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página Búsqueda del Catálogo de conocimiento.

    Ir a Búsqueda

  2. Busca una tabla de BigQuery para la que quieras ver las relaciones.

  3. En los resultados de la búsqueda, haz clic en la tabla para abrir su página de entrada.

En la pestaña Relaciones, se enumeran las relaciones junto con la siguiente información:

  • Destino: Es el nombre del recurso de datos conectado.
  • Relación: Son las columnas específicas que se usan para vincular los recursos.
  • Tipo: Es la naturaleza del vínculo. Por ejemplo, JOIN
  • Origen: Es el origen de la relación. Por ejemplo, el historial de búsquedas.
  • Acción: Es una muestra de consulta que se puede usar para descubrir la vinculación entre los activos.

REST

Las relaciones descubiertas se almacenan en Knowledge Catalog como EntryLinks que establecen una relación entre dos recursos de datos (entradas) en Knowledge Catalog. Los detalles sobre la relación, como las columnas unidas y la fuente de la relación, se almacenan como aspectos de EntryLinks.

Para ver las relaciones de datos, usa los siguientes métodos:

  • LookupEntryLinks recupera todos los EntryLinks que hacen referencia a una entrada de datos específica como la fuente o el destino para devolver el conjunto completo de relaciones asociadas con una entrada determinada.

  • LookupContext proporciona un solo extremo para fundamentar los agentes de IA con metadatos contextuales. Devuelve un paquete conciso y con formato previo de metadatos, incluidos los recursos de datos relacionados.

Ubicaciones

Puedes usar relaciones de datos en todas las ubicaciones de BigQuery.

Limitaciones

  • El descubrimiento automático de relaciones a partir de los registros de consultas solo está disponible para las tablas y vistas de BigQuery.
  • Knowledge Catalog analiza una muestra del historial de búsqueda para identificar relaciones, lo que significa que algunas búsquedas podrían no generar el descubrimiento de vínculos.
  • El descubrimiento de relaciones puede tardar hasta 48 horas después de que se ejecuta la búsqueda.

¿Qué sigue?