Cómo ver las relaciones de datos en Knowledge Catalog

Knowledge Catalog (anteriormente, Dataplex Universal Catalog) descubre vínculos potenciales entre los recursos de datos, lo que te ayuda a descubrir los datos relacionados y comprender la naturaleza de la relación.

Antes de comenzar

Antes de ver las relaciones entre los activos de datos, asegúrate de que se te hayan otorgado los roles necesarios.

Roles obligatorios

Para ver las relaciones entre los recursos de datos en Knowledge Catalog, no necesitas ningún rol de IAM específico de Knowledge Catalog. Knowledge Catalog usa tus permisos existentes en los sistemas fuente en los que residen los activos, como BigQuery, para determinar tu capacidad de ver relaciones. Por ejemplo, para ver las relaciones que involucran una tabla de BigQuery, necesitas el permiso bigquery.tables.get.

Si no tienes permiso para ver un recurso en su sistema fuente, las relaciones que involucren ese recurso se ocultarán en el gráfico de relaciones de Knowledge Catalog. Esto garantiza que la visibilidad de las relaciones cumpla con los límites y permisos de seguridad establecidos en los sistemas fuente.

Acerca de las relaciones de datos

Las relaciones de datos ilustran cómo se conectan los activos de datos. Por ejemplo, si encuentras una tabla con datos de clientes, sus relaciones pueden revelar tablas relacionadas que enumeran pedidos o tickets de asistencia. Además, las relaciones actúan como una guía estructural, ya que proporcionan contexto esencial a los modelos de lenguaje grandes. Como resultado, la IA genera respuestas más precisas y formula consultas exactas para recuperar información específica.

Knowledge Catalog descubre y almacena automáticamente las relaciones comunes entre los recursos de datos. Los datos de relaciones provienen de varias fuentes, como las siguientes:

  • Registros históricos de consultas de Knowledge Catalog que analizan continuamente el historial de consultas para detectar posibles patrones de JOIN entre las tablas.
  • Estadísticas de datos sugiere relaciones de datos a pedido analizando los atributos del esquema y las superposiciones de datos con modelos de lenguaje grandes.

Recursos de datos admitidos

Puedes ver las relaciones de datos de las tablas y vistas de BigQuery.

Cómo ver las relaciones entre los datos

Para ver las relaciones de datos de las tablas y vistas de BigQuery, usa la consola de Google Cloud o la API de Knowledge Catalog.

Console

Para ver las relaciones de datos de una tabla en BigQuery, haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página Búsqueda de Knowledge Catalog.

    Ir a Búsqueda

  2. Busca una tabla de BigQuery para la que quieras ver las relaciones.

  3. En los resultados de la búsqueda, haz clic en la tabla para abrir su página de entrada.

En la pestaña Relaciones, se enumeran las relaciones junto con la siguiente información:

  • Destino: Es el nombre del recurso de datos conectado.
  • Relación: Son las columnas específicas que se usan para vincular los recursos.
  • Tipo: Es la naturaleza del vínculo. Por ejemplo, JOIN
  • Origen: Es el origen de la relación. Por ejemplo, el historial de búsquedas.
  • Acción: Es una muestra de consulta que se puede usar para descubrir la vinculación entre los activos.

REST

Las relaciones descubiertas se almacenan en Knowledge Catalog como EntryLinks que establecen una relación entre dos recursos de datos (entradas) en Knowledge Catalog. Los detalles sobre la relación, como las columnas unidas y la fuente de la relación, se almacenan como aspectos de EntryLinks.

Para ver las relaciones de datos, usa los siguientes métodos:

  • LookupEntryLinks recupera todos los EntryLinks que hacen referencia a una entrada de datos específica como la fuente o el destino para devolver el conjunto completo de relaciones asociadas con una entrada determinada.

  • LookupContext proporciona un solo extremo para fundamentar los agentes de IA con metadatos contextuales. Devuelve un paquete conciso y con formato previo de metadatos, incluidos los recursos de datos relacionados.

Ubicaciones

Puedes usar relaciones de datos en todas las ubicaciones de BigQuery.

Limitaciones

  • El descubrimiento automático de relaciones a partir de los registros de consultas solo está disponible para las tablas y vistas de BigQuery.
  • Knowledge Catalog analiza una muestra del historial de búsqueda para identificar relaciones, lo que significa que algunas búsquedas podrían no generar el descubrimiento de vínculos.
  • El descubrimiento de relaciones puede tardar hasta 48 horas después de que se ejecuta la búsqueda.

¿Qué sigue?