Ver relações de dados no Knowledge Catalog

O Knowledge Catalog (antigo Dataplex Universal Catalog) descobre possíveis links entre ativos de dados, ajudando você a encontrar os dados relacionados e entender a natureza da relação.

Antes de começar

Antes de ver as relações entre recursos de dados, verifique se você tem os papéis necessários.

Funções exigidas

Para ver as relações entre recursos de dados no Knowledge Catalog, não é necessário ter papéis do IAM específicos para o Knowledge Catalog. O Knowledge Catalog usa suas permissões nos sistemas de origem em que os recursos estão localizados, como o BigQuery, para determinar sua capacidade de ver relacionamentos. Por exemplo, para ver relacionamentos envolvendo uma tabela do BigQuery, você precisa da permissão bigquery.tables.get.

Se você não tiver permissão para ver um recurso no sistema de origem, todas as relações envolvendo esse recurso serão ocultadas no gráfico de relações do Knowledge Catalog. Isso garante que a visibilidade de relacionamento obedeça aos limites e permissões de segurança estabelecidos nos sistemas de origem.

Sobre as relações de dados

As relações de dados ilustram como os recursos de dados se conectam. Por exemplo, se você encontrar uma tabela com dados do cliente, as relações dela podem revelar tabelas relacionadas que listam pedidos ou tíquetes de suporte. Além disso, as relações atuam como um guia estrutural, fornecendo contexto essencial para os grandes modelos de linguagem. Como resultado, a IA gera respostas mais precisas, formulando consultas corretas para recuperar informações específicas.

O Knowledge Catalog descobre e armazena automaticamente as relações comuns entre os recursos de dados. Os dados de relacionamento vêm de várias fontes, como:

  • Registros de consultas históricas do Knowledge Catalog que analisam continuamente o histórico de consultas para detectar possíveis padrões de JOIN entre tabelas.
  • Os insights de dados sugerem relações de dados sob demanda analisando atributos de esquema e sobreposições de dados usando modelos de linguagem grandes.

Recursos de dados compatíveis

É possível conferir as relações de dados para tabelas e visualizações do BigQuery.

Ver relações de dados

Para ver as relações de dados das tabelas e visualizações do BigQuery, use o console Google Cloud ou a API Knowledge Catalog.

Console

Para conferir os relacionamentos de dados de uma tabela no BigQuery, faça o seguinte:

  1. No console Google Cloud , acesse a página Pesquisa do Knowledge Catalog.

    Acesse Pesquisar

  2. Pesquise uma tabela do BigQuery para ver os relacionamentos.

  3. Nos resultados da pesquisa, clique na tabela para abrir a página de entrada dela.

A guia Relacionamentos lista os relacionamentos com as seguintes informações:

  • Destino: o nome do recurso de dados conectado.
  • Relacionamento: as colunas específicas usadas para vincular os recursos.
  • Tipo:a natureza do link. Por exemplo, JOIN.
  • Origem:a origem da relação. Por exemplo, o histórico de consultas.
  • Ação:uma consulta de exemplo que pode ser usada para descobrir a relação entre os recursos.

REST

As relações descobertas são armazenadas no Knowledge Catalog como EntryLinks, que estabelecem uma relação entre dois recursos de dados (entradas) no Knowledge Catalog. Os detalhes sobre a relação, como as colunas unidas e a origem da relação, são armazenados como aspectos de EntryLinks.

Para conferir as relações de dados, use os seguintes métodos:

  • LookupEntryLinks recupera todos os EntryLinks que referenciam uma entrada de dados específica como origem ou destino para retornar o conjunto completo de relações associadas a uma determinada entrada.

  • O LookupContext oferece um único endpoint para fundamentar agentes de IA com metadados contextuais. Ele retorna um pacote conciso e pré-formatado de metadados, incluindo ativos de dados relacionados.

Locais

É possível usar relações de dados em todos os locais do BigQuery.

Limitações

  • A descoberta automática de relações nos registros de consultas está disponível apenas para tabelas e visualizações do BigQuery.
  • O Knowledge Catalog analisa uma amostra do histórico de consultas para identificar relações, o que significa que algumas consultas podem não levar à descoberta de links.
  • A descoberta de relações pode levar até 48 horas após a execução da consulta.

A seguir