Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Visão geral dos conjuntos de contexto

Um conjunto de contexto é uma coleção de informações específicas do banco de dados que permite que ferramentas como o QueryData gerem consultas com alta precisão. Ele inclui modelos, facetas e pesquisas de valor que ajudam o QueryData a entender o esquema do banco de dados e a lógica de negócios dos aplicativos.

Os seguintes bancos de dados são compatíveis:

AlloyDB para PostgreSQL
Cloud SQL para MySQL
Cloud SQL para PostgreSQL
Spanner

O que são conjuntos de contexto

Para criar aplicativos de agentes eficazes, ferramentas como o QueryData precisam entender a organização dos dados e a lógica de negócios. Essas informações são fornecidas na forma de um conjunto de contexto.

Você define o contexto em arquivos que contêm objetos JSON para cada tipo de contexto. Esses arquivos de contexto são criados com a ajuda do agente de engenharia de contexto. Em seguida, faça upload do arquivo de contexto para um conjunto de contexto criado no Google Cloud console. Esse processo permite que ferramentas como o QueryData aprendam o esquema específico do banco de dados e a lógica de negócios do aplicativo.

O arquivo de contexto é semelhante a este:

{
  "templates": [
    {
      "nl_query": "Count Prague loan accounts",
      "sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" ='Prague'",
      "intent": "How many accounts associated with loans are located in the Prague region?",
      "manifest": "How many accounts associated with loans are located in a given city?",
      "parameterized": {
        "parameterized_intent": "How many accounts associated with loans are located in $1",
        "parameterized_sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = $1"
      }
    }
  ],
  "facets": [
    {
      "sql_snippet": "employee.\"A11\" BETWEEN 6000 AND 10000",
      "intent": "Average salary between 6000 and 10000",
      "manifest": "Average salary between a given number and a given number",
      "parameterized": {
         "parameterized_intent": "Average salary between $1 and $2",
         "parameterized_sql_snippet": "employee.\"A11\" BETWEEN $1 AND $2"
      }
    }
  ],
  "value_searches": [
    {
      "query": "SELECT $value as value, 'accounts.account_type' as columns, 'Account Type' as concept_type, 0 as distance, '{}'::text as context FROM \"accounts\" T WHERE T.\"account_type\" = $value",
      "concept_type": "Account Type",
      "description": "Exact match for account types"
    }
   ]
}

Formato do arquivo de conjunto de contexto

O arquivo de conjunto de contexto consiste em um conjunto selecionado de modelos e facetas no formato JSON que orientam ferramentas como o QueryData na tradução de perguntas em linguagem natural para consultas de um banco de dados específico. A definição de contexto garante a geração de SQL de alta precisão para padrões de consulta comuns.

Para maximizar a precisão, verifique se o conjunto de contexto é preciso e abrangente na cobertura das consultas de aplicativos esperadas.

Os conjuntos de contexto podem ser criados nas regiões us-central1, us-east1, europe-west4 e asia-southeast1.

Modelos de consulta

Os modelos de consulta são um conjunto selecionado de perguntas representativas em linguagem natural com consultas SQL correspondentes. Eles também incluem explicações para fornecer uma justificativa declarativa para a geração de linguagem natural para SQL.

Um objeto de modelo de consulta é semelhante a este:

{
  "templates": [
    {
      "nl_query": "Count prague loan accounts",
      "sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = 'Prague'",
      "intent": "How many accounts associated with loans are located in the Prague region?",
      "manifest": "How many accounts associated with loans are located in a given city?",
      "parameterized": {
        "parameterized_intent": "How many accounts associated with loans are located in $1",
        "parameterized_sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = $1"
      }
    }
  ]
},
...

Os principais componentes do objeto JSON do modelo de consulta são os seguintes:

nl_query: um exemplo de consulta em linguagem natural que ferramentas como o QueryData processam.
sql: a consulta SQL para a consulta em linguagem natural.
intent: o objetivo ou finalidade da consulta em linguagem natural. Se não estiver definido, esse valor será padrão para a consulta em linguagem natural.
manifest: uma forma generalizada e gerada automaticamente da intent.
parameterized_intent: uma forma de modelo e gerada automaticamente da intent, com valores de entidade substituídos por parâmetros.
parameterized_sql: uma forma de modelo e gerada automaticamente da consulta SQL que corresponde à intent parametrizada.

As facetas de consulta são um conjunto selecionado de condições representativas em linguagem natural com predicados SQL correspondentes. As facetas gerenciam a filtragem e as condições, o que permite que os modelos de consulta realizem pesquisas facetadas.

Um objeto de faceta de consulta é semelhante a este:

{
...
"facets": [
    {
      "sql_snippet": "employee.\"A11\" BETWEEN 6000 AND 10000",
      "intent": "Average salary between 6000 and 10000",
      "manifest": "Average salary between a given number and a given number",
      "parameterized": {
         "parameterized_intent": "Average salary between $1 and $2",
         "parameterized_sql_snippet": "employee.\"A11\" BETWEEN $1 AND $2"
      }
    }
  ]
}

Os principais componentes do objeto JSON de faceta são os seguintes:

sql_snippet: um snippet SQL. Para evitar ambiguidades, qualifique os nomes das colunas com nomes de tabelas (por exemplo, table_name.column_name).
intent: uma explicação do predicado SQL.
manifest: uma forma generalizada e gerada automaticamente da intent.
parameterized_intent: uma forma de modelo e gerada automaticamente da intent, com valores de entidade substituídos por parâmetros.
parameterized_sql_snippet: uma forma de modelo e gerada automaticamente do sql_snippet que corresponde à intent parametrizada.

Consultas de pesquisa de valor

As consultas de pesquisa de valor são consultas definidas pelo desenvolvedor que usam funções de correspondência para encontrar valores e o contexto deles em um banco de dados. A vinculação de valores usa os resultados dessas consultas para identificar quais tabelas e colunas contêm um valor correspondente, entender o tipo de conceito do valor e corrigir erros de ortografia.

A API QueryData usa a vinculação de valores para converter a linguagem natural em SQL com mais precisão. Ao usar consultas de pesquisa de valor, a API pode corrigir erros de ortografia e resolver tipos de valor com base nos valores do banco de dados, melhorando a precisão da conversão.

A vinculação de valores melhora a precisão da conversão de linguagem natural para SQL. Por exemplo, se um usuário perguntar "Há voos saindo de Heathrow?", o banco de dados poderá armazenar o nome do aeroporto como "London Heathrow". Sem a vinculação de valores, o SQL gerado poderá filtrar por WHERE name = 'Heathrow' e não retornar resultados. As consultas de pesquisa de valor orientam o agente a mapear "Heathrow" para o valor correto do banco de dados "London Heathrow" e o local do esquema (airports.name), garantindo que o SQL gerado seja preciso.

Um exemplo de consulta de pesquisa de valor é:

{
  ...
  "value_searches": [
    {
      "query": "SELECT $value as value, 'airports.iata' as columns, 'Airport IATA Code' as concept_type, 0 as distance, '{}'::text as context FROM \"airports\" T WHERE T.\"iata\" = $value",
      "concept_type": "Airport IATA Code",
      "description": "Exact match (Standard SQL) for 3-letter airport codes"
    },
    {
      "query": "WITH TrigramMetrics AS ( SELECT T.\"name\" AS original_value, (T.\"name\" <-> $value::text) AS normalized_dist FROM \"airports\" T WHERE T.\"name\" % $value::text ) SELECT original_value AS value, 'airports.name' AS columns, 'Airport Name' AS concept_type, normalized_dist AS distance, '{}'::text AS context FROM TrigramMetrics",
      "concept_type": "Airport Name",
      "description": "Fuzzy match using standard trigram for partial airport names"
    },
    {
      "query": "WITH SemanticMetrics AS ( SELECT T.\"city\" AS original_value, ( (google_ml.embedding('gemini-embedding-001', $value)::vector <=> google_ml.embedding('gemini-embedding-001', T.\"city\")::vector) / 2.0 ) AS normalized_dist FROM \"airports\" T WHERE T.\"city\" IS NOT NULL ) SELECT original_value AS value, 'airports.city' AS columns, 'Airport City' AS concept_type, normalized_dist AS distance, '{}'::text AS context FROM SemanticMetrics",
      "concept_type": "Airport City",
      "description": "Semantic search on string values for airport city names"
    }
  ]
}

Os principais componentes do objeto JSON de pesquisa de valor são os seguintes:

query: uma instrução SQL parametrizada que define a lógica para corresponder uma frase de valor aos valores armazenados em uma coluna de uma tabela em um banco de dados. O conjunto de resultados normalmente projeta o valor correspondente, o local do esquema, o tipo de conceito e uma métrica de distância normalizada (entre 0 e 1).
concept_type: um rótulo semântico atribuído ao valor, por exemplo, o district ou o loan_status. Esse rótulo ajuda a vinculação de valores e, por fim, as ferramentas, como a API QueryData, a entender o papel da frase de valor no esquema. Ele também ajuda a produzir uma instrução SQL que segmenta o conceito do valor, bem como a tabela e a coluna em que a frase de valor aparece.
description: uma descrição da lógica de pesquisa.

Limitações

Os conjuntos de contexto têm as seguintes limitações:

O Cloud SQL para SQL Server não é compatível.
Os conjuntos de contexto para bancos de dados só oferecem suporte a modelos, facetas e pesquisas de valor.
Os conjuntos de contexto para bancos de dados são usados apenas pelo endpoint QueryData na API Conversational Analytics.

A seguir

Saiba como criar ou excluir um conjunto de contexto no Cloud SQL Studio.
Saiba como criar conjuntos de contexto usando o agente de engenharia de contexto.