Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Visão geral da IA generativa

Neste documento, descrevemos as funções de inteligência artificial (IA) generativa compatíveis com o BigQuery. Essas funções aceitam entradas de linguagem natural e usam modelos da Gemini Enterprise Agent Platform pré-treinados e modelos integrados do BigQuery.

O BigQuery oferece várias funções de IA para ajudar em tarefas como:

Gerar conteúdo criativo.
Analisar, detectar sentimentos e responder a perguntas sobre texto ou dados não estruturados, como imagens.
Resuma as principais ideias ou impressões transmitidas pelo conteúdo.
Extrair dados estruturados do texto.
Classificar texto ou dados não estruturados em categorias definidas pelo usuário.
Gere embeddings para pesquisar textos, imagens e vídeos semelhantes.
Classifique as entradas para classificá-las por qualidade, semelhança ou outros critérios.

As funções de IA são agrupadas nas seguintes categorias para ajudar você a realizar essas tarefas:

Funções de IA de uso geral:essas funções oferecem controle total e transparência na escolha do modelo, do comando e dos parâmetros a serem usados.
- Realizar inferência de LLM, como responder a perguntas sobre seus dados
  - AI.GENERATE é a função de inferência mais flexível, que permite analisar qualquer dado estruturado ou não estruturado.
  - AI.GENERATE_TEXT é uma versão com valor de tabela de AI.GENERATE que também oferece suporte a modelos de parceiros e de código aberto.
- Gerar saída estruturada, como extrair nomes, endereços ou descrições de objetos de texto, documentos ou imagens.
  - AI.GENERATE, quando você especifica um esquema de saída.
  - AI.GENERATE_TABLE é uma versão com valor de tabela de AI.GENERATE que chama um modelo remoto e permite especificar um esquema de saída personalizado.
  - Se o esquema de saída tiver um único campo, use uma das funções especializadas: AI.GENERATE_BOOL, AI.GENERATE_DOUBLE ou AI.GENERATE_INT.
- Gerar embeddings para pesquisa semântica e clustering
  - AI.EMBED: cria um embedding com base em dados de texto ou imagem.
  - AI.GENERATE_EMBEDDING: uma função com valor de tabela que adiciona uma coluna de texto, imagem, áudio, vídeo ou dados de documento incorporados à sua tabela.
Funções de IA gerenciadas:essas funções têm uma sintaxe simplificada e são otimizadas para custo e qualidade. Com o modo otimizado (pré-lançamento), essas funções são dimensionadas para milhões ou bilhões de linhas.
- AI.IF: filtre seus dados com condições de linguagem natural.
- AI.SCORE: classificar a entrada, como por qualidade ou sentimento.
- AI.CLASSIFY: classifique a entrada em categorias definidas pelo usuário.
- AI.AGG: agregue a entrada para resumir ou analisar seus dados.
Funções utilitárias:use a função AI.COUNT_TOKENS para estimar o número de tokens em um comando de entrada antes de executar uma consulta.
Funções específicas para tarefas:essas funções usam APIs de IA do Google Cloud para ajudar você a realizar tarefas como processamento de linguagem natural, tradução automática, processamento de documentos, transcrição de áudio e visão computacional.

Funções de IA de uso geral

As funções de IA de uso geral oferecem controle total e transparência na escolha do modelo, do comando e dos parâmetros a serem usados. A saída inclui informações detalhadas sobre a chamada ao modelo, incluindo o status e a resposta completa do modelo, que pode incluir informações sobre a classificação de segurança ou citações.

Fazer inferência de LLM

A função AI.GENERATE é uma função de inferência flexível que envia solicitações a um modelo do Gemini na Gemini Enterprise Agent Platform e retorna a resposta desse modelo. Você pode usar essa função para analisar dados de texto, imagem, áudio, vídeo ou PDF. Por exemplo, você pode analisar imagens de móveis para gerar texto para uma coluna design_type, de modo que o SKU dos móveis tenha uma descrição associada, como mid-century modern ou farmhouse.

É possível realizar tarefas de IA generativa usando modelos remotos no BigQuery ML para referenciar modelos implantados ou hospedados no Agent Platform com a função com valor de tabela AI.GENERATE_TEXT. É possível usar os seguintes tipos de modelos remotos:

Modelos remotos em qualquer um dos modelos do Gemini disponíveis de maneira geral ou em prévia para analisar conteúdo de texto, imagem, áudio, vídeo ou PDF de tabelas padrão ou de objetos com um comando fornecido como argumento de função.
Modelos remotos do Anthropic Claude, Mistral AI ou Llama, ou modelos abertos compatíveis para analisar um comando fornecido em uma consulta ou de uma coluna em uma tabela padrão.

Use os tópicos a seguir para testar a geração de texto no BigQuery ML:

Em alguns modelos, é possível configurar o ajuste supervisionado, que permite treinar o modelo com seus próprios dados para que ele se adapte melhor ao seu caso de uso. Toda inferência ocorre na Agent Platform. Os resultados são armazenados no BigQuery.

Gerar dados estruturados

A geração de dados estruturados é muito semelhante à geração de texto, exceto que você pode formatar a resposta do modelo especificando um esquema SQL. Por exemplo, é possível gerar uma tabela que contenha o nome, o número de telefone, o endereço, o pedido e a cotação de preços de um cliente com base na transcrição de uma ligação.

É possível gerar dados estruturados das seguintes maneiras:

A função AI.GENERATE chama um endpoint do Agent Platform e pode gerar um valor STRUCT com seu esquema personalizado.

Para testar, saiba como usar saída estruturada ao chamar a função AI.GENERATE.
A função AI.GENERATE_TABLE chama um modelo remoto e é uma função com valor de tabela que gera uma tabela com seu esquema personalizado.

Para criar dados estruturados, consulte Gerar dados estruturados usando a função AI.GENERATE_TABLE.
Para um único campo de saída, use uma das seguintes funções de inferência especializadas:

Gerar embeddings

Um embedding é um vetor numérico de alta dimensão que representa uma determinada entidade, como um texto ou um arquivo de áudio. A geração de embeddings permite capturar a semântica dos seus dados de uma forma que facilita o raciocínio e a comparação.

Confira alguns casos de uso comuns para a geração de embeddings:

Usar a geração aumentada por recuperação (RAG) para aumentar as respostas do modelo às consultas do usuário referenciando dados adicionais de uma fonte confiável. A RAG oferece melhor acurácia factual e consistência de resposta, além de acesso a dados mais recentes que os dados de treinamento do modelo.
Realizando a pesquisa multimodal. Por exemplo, usar a entrada de texto para pesquisar imagens.
Realizar pesquisa semântica para encontrar itens semelhantes para recomendações, substituição e remoção de registros duplicados.
Como criar embeddings para usar com um modelo k-means para clustering.

Para mais informações sobre como gerar embeddings e usá-los para realizar essas tarefas, consulte a Introdução a embeddings e pesquisa vetorial.

Funções de IA gerenciadas

As funções de IA gerenciadas simplificam tarefas rotineiras, como filtragem, classificação ou agregação. Essas funções podem analisar dados de texto, imagem, áudio, vídeo ou PDF. Essas funções usam o Gemini e não exigem personalização. O BigQuery usa engenharia de comandos e pode selecionar o modelo e os parâmetros adequados para a tarefa específica, otimizando a qualidade e a consistência dos resultados. Cada função retorna um valor escalar, como um BOOL, FLOAT64 ou STRING, e não inclui informações de status adicionais do modelo. As seguintes funções gerenciadas de IA estão disponíveis:

AI.IF: filtra texto ou dados multimodais, como em uma cláusula WHERE ou JOIN, com base em um comando. Por exemplo, você pode filtrar as descrições de produtos por aquelas que descrevem um item que seria um bom presente.
AI.SCORE: Avalie as entradas com base em um comando para classificar as linhas por qualidade, similaridade ou outros critérios. É possível usar essa função em uma cláusula ORDER BY para extrair os K principais itens de acordo com a pontuação. Por exemplo, você pode encontrar as 10 avaliações de usuários mais positivas ou negativas de um produto.
AI.CLASSIFY: classifica texto em categorias definidas pelo usuário. É possível usar essa função em uma cláusula GROUP BY para agrupar entradas de acordo com as categorias definidas. Por exemplo, você pode classificar os tíquetes de suporte de acordo com o assunto: faturamento, frete, qualidade do produto ou outro.
AI.AGG: agregue entradas com base em instruções de linguagem natural para resumir ou analisar seus dados. Por exemplo, você pode analisar os registros de sessões de aplicativos do usuário para determinar onde os clientes estão tendo dificuldades ou resumir o conteúdo de um grande conjunto de imagens.

Para um tutorial com exemplos de como usar essas funções, consulte Realizar análises semânticas com funções de IA gerenciadas.

Para um tutorial em notebook que mostra como usar funções de IA gerenciadas e de uso geral, consulte Análise semântica com funções de IA.

Funções específicas para tarefas

Além das funções mais gerais descritas nas seções anteriores, é possível desenvolver soluções específicas para tarefas no BigQuery ML usando APIs da IA do Google Cloud. Veja a seguir algumas das tarefas disponíveis:

Para mais informações, consulte Visão geral das soluções específicas para tarefas.

Locais

Os locais aceitos para modelos de geração e embedding de texto variam de acordo com o tipo e a versão do modelo que você usa. Para mais informações, consulte Locais.

Preços

Você recebe cobranças pelos recursos de computação usados para executar consultas em modelos. Os modelos remotos fazem chamadas para modelos da Agent Platform. Portanto, as consultas feitas a eles também geram cobranças da Agent Platform.

Para mais informações, consulte os preços do BigQuery ML.

Acompanhar o uso de tokens

Ao chamar uma função de IA generativa que usa um modelo do Gemini diferente de um modelo de embedding, é possível conferir o número total de cada tipo de token processado pela consulta. No painel Resultados da consulta, clique em Informações do job. As seguintes contagens aparecem, divididas por modalidade, se aplicável:

Contagem de tokens de entrada:o número total de tokens de entrada para todas as funções de IA generativa chamadas na consulta.
Contagem de tokens de saída. O número total de tokens em todas as respostas candidatas geradas pela consulta.
Contagem de tokens de raciocínio. O número total de tokens que faziam parte dos pensamentos gerados pelo modelo, se aplicável.
Contagem de tokens do cache. O número total de tokens de entrada que foram armazenados em cache implicitamente pela consulta.

Monitorar custos

As funções de IA generativa no BigQuery enviam solicitações para a plataforma de agentes do Gemini Enterprise, o que pode gerar custos. Para estimar a contagem de tokens de entrada antes de executar uma consulta, use a função AI.COUNT_TOKENS. Para acompanhar os custos da Agent Platform incorridos por um job executado no BigQuery, siga estas etapas:

Confira seus relatórios de faturamento no Cloud Billing.
Use filtros para refinar os resultados.

Em "Serviços", selecione Vertex AI.
Para conferir as cobranças de um job específico, filtre por rótulo.

Defina a chave como bigquery_job_id_prefix e o valor como o ID do job. Se o ID do job tiver mais de 63 caracteres, use apenas os primeiros 63. Se o ID do seu job tiver caracteres maiúsculos, mude para minúsculos. Outra opção é associar trabalhos a um rótulo personalizado para facilitar a pesquisa depois.

Pode levar até 24 horas para que algumas cobranças apareçam no Cloud Billing.

Monitoramento

Para entender melhor o comportamento das funções de IA que você chama no BigQuery, ative o registro de solicitações e respostas. Para registrar toda a solicitação e resposta enviada e recebida da Agent Platform, siga estas etapas:

Ative os registros de solicitação/resposta na plataforma de agentes do Gemini Enterprise. Os registros são armazenados no BigQuery. É necessário ativar a geração de registros separadamente para cada modelo de base e região. Para registrar consultas executadas na região us, especifique a região us-central1 na sua solicitação. Para registrar consultas executadas na região eu, especifique a região europe-west4 na sua solicitação.
Execute uma consulta usando uma função de IA que faz uma chamada para a Agent Platform usando o modelo em que você ativou a geração de registros na etapa anterior.
Para conferir a solicitação e a resposta completas da Agent Platform, consulte sua tabela de registros em busca de linhas em que o campo labels.bigquery_job_id_prefix da coluna full_request corresponda aos primeiros 63 caracteres do seu ID do job. Se quiser, use um rótulo de consulta personalizada para ajudar a pesquisar a consulta nos registros.

Por exemplo, você pode usar uma consulta semelhante a esta:
```
SELECT *
FROM `my_project.my_dataset.request_response_logging`
WHERE JSON_VALUE(full_request, '$.labels.bigquery_job_id_prefix') = 'bquxjob_123456...';
```

Gerenciamento de erros

Erros no nível da linha, como RESOURCE_EXHAUSTED, podem ocorrer se uma função de IA exceder a cota ou os limites do serviço remoto. Quando um erro no nível da linha ocorre, a função retorna NULL para essa linha, o que pode resultar em resultados de consulta incompletos.

Todas as funções de IA podem encontrar esses erros. No entanto, as funções de IA gerenciadas (AI.IF, AI.CLASSIFY e AI.SCORE) oferecem suporte ao argumento max_error_ratio para ajudar você a gerenciá-las. Use esse argumento para definir um limite de falha que permita que a consulta seja concluída apesar das falhas no nível da linha.

O valor padrão de max_error_ratio é 1.0. Para diminuir a tolerância a erros, defina um valor menor (por exemplo, 0.2) para que a consulta falhe em vez de ser concluída com falhas parciais. Para detalhes da sintaxe, consulte a documentação de referência para AI.IF, AI.CLASSIFY ou AI.SCORE.

Se a consulta for concluída com falhas parciais, o BigQuery vai retornar um aviso. Para mais informações sobre os erros de função, consulte o campo Erros de função de IA generativa na guia Informações do job dos resultados da consulta no console Google Cloud .

Se a consulta incluir uma cláusula LIMIT, o limite será aplicado depois que o modelo processar um lote de linhas. Consequentemente, a proporção de valores NULL no conjunto de resultados final pode parecer maior do que o max_error_ratio especificado.

Por exemplo, suponha que sua consulta tenha uma cláusula LIMIT 10 e um max_error_ratio de 0.2. O modelo pode processar 20 linhas antes que o limite seja aplicado. Se três dessas 20 linhas falharem, a proporção de erros será 0.15 (15%), que está dentro do limite de 20%. No entanto, se o subconjunto de linhas selecionado pela cláusula LIMIT incluir todas as três linhas com falha, a saída visível vai conter 30% de valores NULL.

A seguir

Para uma introdução à IA e ao ML no BigQuery, consulte Introdução à IA e ao ML no BigQuery.
Para mais informações sobre como realizar inferência em modelos de machine learning, consulte Visão geral da inferência de modelos.
Para mais informações sobre as instruções e funções SQL compatíveis com modelos de IA generativa, consulte Jornadas do usuário completas para modelos de IA generativa.