Este documento responde a algumas das perguntas frequentes relacionadas ao Knowledge Catalog (antigo Dataplex Universal Catalog).
Para mais informações sobre o Knowledge Catalog, consulte Visão geral do Knowledge Catalog.
O que é o Knowledge Catalog?
O Google Knowledge Catalog é uma solução inteligente de governança para dados e recursos de IA no Google Cloud. Ele oferece um inventário centralizado em que você pode descobrir, gerenciar e governar seus dados em Google Cloud fontes de dados como BigQuery, Cloud Storage, Pub/Sub e Spanner. Ele usa a IA para automatizar a descoberta de dados, o enriquecimento de metadados e a qualidade de dados. Com o catálogo de dados governado, o Knowledge Catalog oferece o embasamento essencial de que os agentes de IA precisam para gerar conteúdo de alta qualidade.
O que é o Data Catalog?
Data Catalog era o nome original do Google Cloud's serviço de metadados do. Com o tempo, ele evoluiu para o Dataplex Universal Catalog e agora foi renomeado e evoluiu para o Knowledge Catalog.
Embora o termo "Data Catalog" ainda seja usado para descrever esse tipo de indexação de dados, no contexto do Google Cloud, ele se refere ao nosso produto legado. Recomendamos que todos os novos projetos usem o Knowledge Catalog para aproveitar os recursos com tecnologia de IA e a governança aprimorada.
O Knowledge Catalog é diferente do Data Catalog?
Sim, o Knowledge Catalog é a plataforma de governança de dados com tecnologia de IA que acaba substituindo o Data Catalog. Embora compartilhem conceitos semelhantes, o Knowledge Catalog oferece vários aprimoramentos:
Contexto com tecnologia de IA: ao contrário do Data Catalog, o Knowledge Catalog usa o Gemini para extrair automaticamente o contexto comercial, gerar descrições em linguagem natural e fornecer "consultas de ouro" em SQL para fundamentar agentes de IA.
Suporte a metadados avançados: o Knowledge Catalog oferece suporte a tipos de metadados mais complexos, como matrizes, mapas e registros aninhados.
Acesso agêntico: os agentes de IA podem descobrir e usar de forma adaptável as ferramentas do Knowledge Catalog por meio de um servidor MCP local ou remoto.
Descoberta de dados: o Knowledge Catalog pode ingerir automaticamente metadados de um conjunto maior de serviços e fontes de dados externos. Google Cloud
Governança em escala: ele oferece recursos aprimorados para criação de perfis de dados, qualidade de dados automática e governança centralizada.
Para que o Knowledge Catalog é usado?
O Google Knowledge Catalog resolve o problema de "inicialização a frio de dados", ou seja, o tempo perdido tentando encontrar, entender e confiar nos dados antes de poder usá-los. Os principais usos incluem o seguinte:
Descoberta de dados acelerada: em vez de navegar por silos organizacionais complexos para localizar dados, você pode usar a pesquisa com linguagem natural (por exemplo, "Mostre os dados mais recentes de desistência de usuários") para encontrar recursos em todos os recursos instantaneamente, aumentando a produtividade dos consumidores de dados.Google Cloud
Embasamento de agentes de IA: ele atua como a "fonte da verdade" para IA generativa ou ADK. Ao vincular dados físicos a definições de negócios, ele garante que os agentes de IA (como os criados na Vertex AI) usem dados de alta qualidade, o que reduz significativamente as alucinações de IA e melhora a confiança nos insights gerados por IA.
Governança de dados automatizada: ele verifica automaticamente seus dados para identificar informações sensíveis (como PII), rastreia a origem dos dados (linhagem) e monitora a precisão deles (qualidade de dados automática). Esses recursos ajudam a melhorar a confiança, a segurança e a conformidade dos dados com menos esforço manual.
Descoberta de "dados ocultos": ele pode verificar arquivos não estruturados (como PDFs ou imagens no Cloud Storage), extrair as informações internas e torná-las pesquisáveis e consultáveis no BigQuery, o que ajuda a desbloquear insights de dados inacessíveis anteriormente.
Para casos de uso práticos, consulte Analisar o Knowledge Catalog.
Quais tipos de metadados o Knowledge Catalog armazena?
O Knowledge Catalog armazena três tipos de metadados:
Metadados técnicos: esquemas, nomes de tabelas e propriedades do sistema coletados automaticamente.
Metadados de negócios: contexto definido pelo usuário, como descrições comerciais, termos de glossário e propriedade.
Metadados de execução: informações sobre linhagem de dados, pontuações de qualidade de dados e estatísticas de criação de perfis de dados.
Como faço para migrar do Data Catalog?
A transição para o Knowledge Catalog foi projetada para ser perfeita, sem necessidade de movimentação manual de dados. Dependendo do seu uso atual, o processo envolve duas fases principais:
Fase preparatória: se você tiver metadados personalizados (tags, modelos de tag ou entradas personalizadas), esse conteúdo será transferido automaticamente para o Knowledge Catalog como somente leitura. Durante essa fase, você realiza tarefas de configuração para disponibilizar o conteúdo do Data Catalog simultaneamente na nova interface.
Fase de transferência: depois de preparado, você transfere o estado ativo dos metadados para torná-los de leitura e gravação no Knowledge Catalog. Essa etapa precisa ser coordenada com a atualização de cargas de trabalho programáticas (APIs, bibliotecas de cliente ou módulos do Terraform) para apontar para os novos endpoints do Knowledge Catalog.
Se você não tiver metadados personalizados ou se for novo na plataforma, pode concluir a transição definindo o Knowledge Catalog como a experiência de UI padrão noconsole. Google Cloud
Para mais informações, consulte Fazer a transição do Data Catalog para o Knowledge Catalog.