Com as análises de conversação no BigQuery, é possível consultar seus dados de formato aberto usando comandos em linguagem natural. Esse recurso depende do catálogo de ambiente de execução do Lakehouse no Lakehouse para Apache Iceberg para mapear automaticamente suas perguntas aos esquemas de tabela subjacentes. Assim, você pode gerar e executar consultas SQL sem escrever o código manualmente.
Ao configurar suas consultas, use os agentes de dados para fornecer glossários de negócios e instruções do sistema para aumentar a precisão.
Como a análise de conversas funciona
A análise de conversas usa modelos de linguagem grandes (LLMs) para entender suas perguntas em linguagem natural e mapeá-las para o esquema das suas tabelas. O processo segue estas etapas:
- Descoberta de esquema: o sistema recupera metadados do catálogo de tempo de execução do Lakehouse para entender as estruturas de tabelas, os nomes das colunas e os tipos de dados.
- Geração de SQL: o LLM gera uma consulta SQL compatível com o mecanismo do BigQuery e o formato de dados subjacente.
- Execução: o BigQuery executa a consulta SQL gerada diretamente nos dados de formato aberto no Lakehouse do Google Cloud.
- Resposta: os resultados são retornados à interface de conversa, geralmente acompanhados de um resumo ou uma visualização.
Para mais informações sobre análises de conversação, como gerenciamento de agentes de dados, preços ou práticas recomendadas, consulte Visão geral das análises de conversação.
Formatos compatíveis
A análise conversacional traduz suas perguntas em linguagem natural para consultas SQL. Ele oferece suporte aos formatos de tabela aberta compatíveis com o catálogo de tempo de execução do Lakehouse, como tabelas do Apache Iceberg.
Antes de começar
Antes de consultar os dados, registre as tabelas externas no< catálogo de ambientes de execução do Lakehouse. O catálogo de tempo de execução do Lakehouse atua como o hub unificado que conecta o BigQuery Studio aos seus dados externos de formato aberto. Depois de conectadas, as tabelas se tornam recursos detectáveis no BigQuery.
Consultar tabelas com a análise de conversas
No console Google Cloud , acesse o Hub de agentes do BigQuery Studio.
Crie um agente de dados ou inicie uma conversa direta com um agente de dados existente.
Selecione as tabelas.
Como o catálogo do ambiente de execução do Lakehouse unifica todos esses formatos diferentes, a experiência de descoberta é idêntica à de encontrar tabelas padrão do BigQuery.
Pesquisar: ao adicionar sua fonte de conhecimento, procure os nomes das tabelas na interface de pesquisa e seleção. Você pode usar palavras-chave de pesquisa para filtrar resultados, incluindo:
TABLE_NAMEcatalog: CATALOG_NAMEproject: PROJECT_IDnamespace: NAMESPACE_NAME
Verifique a origem: preste atenção à parte do conjunto de dados no nome totalmente qualificado. As tabelas criadas por fontes externas e gerenciadas pelo catálogo de tempo de execução do Lakehouse geralmente seguem um formato que combina o catálogo e o namespace. Por exemplo,
PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_tableouPROJECT_ID.sap_catalog.sales.delta_table.Selecionar: adiciona a tabela selecionada ao contexto de conversa ativo.
Faça perguntas em linguagem natural. O sistema traduz automaticamente seu comando em uma consulta SQL federada.
Melhorar a precisão da consulta
Para ajudar a análise de conversação a entender melhor seus esquemas e terminologia, use as opções de configuração do agente de dados. Essas opções incluem glossários de negócios, consultas SQL verificadas e instruções do sistema.
A seguir
- Saiba mais sobre a análise de conversação no BigQuery.
- Saiba como registrar tabelas externas no catálogo de tempo de execução do Lakehouse.
- Saiba mais sobre os agentes de dados.