Vista geral da IA generativa
Este documento descreve as funções de inteligência artificial (IA) generativa que o BigQuery suporta. Estas funções aceitam entradas de linguagem natural e usam modelos do Vertex AI pré-formados e modelos do BigQuery incorporados.
Vista geral
O BigQuery oferece uma variedade de funções de IA para ajudar com tarefas como as seguintes:
- Gerar conteúdo criativo.
- Analisar, detetar sentimentos e responder a perguntas sobre texto ou dados não estruturados, como imagens.
- Resumir as principais ideias ou impressões transmitidas pelo conteúdo.
- Extraia dados estruturados de texto.
- Classificar texto ou dados não estruturados em categorias definidas pelo utilizador.
- Gerar incorporações para pesquisar texto, imagens e vídeos semelhantes.
- Classificar as entradas para as ordenar por qualidade, semelhança ou outros critérios.
Existem duas categorias principais de funções de IA para ajudar a realizar estas tarefas:
Funções de IA de uso geral: estas funções dão-lhe controlo total e transparência na escolha do modelo, comando e parâmetros a usar.
Realizar inferências, como responder a perguntas sobre os seus dados
AI.GENERATEé a função de inferência mais flexível, que lhe permite analisar qualquer combinação de texto e dados não estruturados, e permite-lhe gerar dados estruturados que correspondem ao seu esquema personalizado.Se precisar de um resultado de um tipo específico, selecione uma das seguintes funções de inferência mais especializadas:
AI.GENERATE_BOOLAI.GENERATE_DOUBLEAI.GENERATE_INT
Gerar resultados estruturados, como extrair nomes e moradas de texto não estruturado
AI.GENERATE, quando especifica umoutput_schemaAI.GENERATE_TABLE
Gere texto com uma versão de função de valor de tabela de
AI.GENERATEAI.GENERATE_TEXT
Gere incorporações para pesquisa semântica e agrupamento
AI.EMBEDAI.GENERATE_EMBEDDINGAI.SIMILARITY
Funções de IA geridas: estas funções têm uma sintaxe simplificada e são otimizadas em função do custo e da qualidade. O BigQuery escolhe um modelo por si.
Filtre os seus dados com condições de linguagem natural
AI.IF
Classificar a entrada, por exemplo, por qualidade ou sentimento
AI.SCORE
Classificar a entrada em categorias definidas pelo utilizador
AI.CLASSIFY
Funções de IA de utilização geral
As funções de IA de uso geral oferecem controlo total e transparência na escolha do modelo, do comando e dos parâmetros a usar. O resultado inclui informações detalhadas sobre a chamada para o modelo, incluindo o estado e a resposta completa do modelo, que podem incluir informações sobre a classificação de segurança ou citações.
Gere dados estruturados
A geração de dados estruturados é muito semelhante à geração de texto, exceto que pode formatar a resposta do modelo especificando um esquema SQL. Por exemplo, pode gerar uma tabela que contenha o nome, o número de telefone, a morada, o pedido e a estimativa do custo de um cliente a partir da transcrição de uma chamada telefónica.
Existem duas formas de gerar dados estruturados:
A função
AI.GENERATEchama um ponto final da Vertex AI e pode gerar um valorSTRUCTcom o seu esquema personalizado.Para experimentar, veja como usar a saída estruturada quando chamar a função
AI.GENERATE.A função
AI.GENERATE_TABLEchama um modelo remoto e é uma função de valor de tabela que gera uma tabela com o seu esquema personalizado.Para experimentar criar dados estruturados, consulte o artigo Gere dados estruturados através da função
AI.GENERATE_TABLE.
Gere valores de um tipo específico por linha
Pode usar funções de IA generativa escalares com modelos Gemini para
analisar dados em tabelas padrão do BigQuery. Os dados incluem dados de texto e dados não estruturados de colunas que contêm valores ObjectRef.
Para cada linha na tabela, estas funções geram resultados que contêm um tipo específico. Por exemplo, pode analisar imagens de mobiliário doméstico para gerar texto para uma coluna design_type, de modo que o SKU do mobiliário tenha uma descrição associada, como mid-century modern ou farmhouse.
Estão disponíveis as seguintes funções de IA:
Quando usa a função AI.GENERATE com modelos Gemini suportados, pode usar o débito processado do Vertex AI para fornecer um débito elevado consistente para pedidos. Para mais informações, consulte o artigo
Use o débito aprovisionado da Vertex AI.
Gere texto com um TVF
Pode realizar tarefas de IA generativa através da função com valor de tabela GENERATE_TEXT, que usa modelos remotos no BigQuery ML para referenciar modelos implementados ou alojados na Vertex AI. Pode criar os seguintes tipos de modelos remotos:
- Modelos remotos através de qualquer um dos modelos do Gemini geralmente disponíveis ou em pré-visualização.
Modelos remotos em relação aos seguintes modelos de parceiros:
Depois de criar um modelo remoto, pode usar a função AI.GENERATE_TEXT para interagir com esse modelo:
Para modelos remotos baseados em modelos Gemini, pode fazer o seguinte:
Use a função
AI.GENERATE_TEXTpara gerar texto a partir de um comando que especifica numa consulta ou extrai de uma coluna numa tabela padrão. Quando especifica o comando numa consulta, pode fazer referência aos seguintes tipos de colunas de tabelas no comando:STRINGcolunas para fornecer dados de texto.STRUCTcolunas que usam oObjectRefformato para fornecer dados não estruturados. Tem de usar aOBJ.GET_ACCESS_URLfunção no comando para converter os valoresObjectRefem valoresObjectRefRuntime.
Use a função
AI.GENERATE_TEXTpara analisar conteúdo de texto, imagem, áudio, vídeo ou PDF de uma tabela de objetos com um comando que fornece como argumento de função.
Para todos os outros tipos de modelos remotos, pode usar a função
AI.GENERATE_TEXTcom um comando que fornece numa consulta ou a partir de uma coluna numa tabela padrão.
Use os seguintes tópicos para experimentar a geração de texto no BigQuery ML:
- Gere texto através de um modelo do Gemini e da função
AI.GENERATE_TEXT. - Gere texto através de um modelo Gemma e da função
AI.GENERATE_TEXT. - Analise imagens com um modelo Gemini.
- Gere texto com a função
AI.GENERATE_TEXTcom os seus dados. - Ajuste um modelo com os seus dados.
Pode usar a
fundamentação
e os
atributos de segurança
quando usa modelos Gemini com a função AI.GENERATE_TEXT,
desde que esteja a usar uma tabela padrão para a entrada. A fundamentação permite que o modelo Gemini use informações adicionais da Internet para gerar respostas mais específicas e factuais. Os atributos de segurança permitem que o modelo
Gemini filtre as respostas que devolve com base nos
atributos que especificar.
Para alguns modelos, pode optar por configurar a ajustamento supervisionado, que lhe permite preparar o modelo com os seus próprios dados para o adequar melhor ao seu exemplo de utilização. Toda a inferência ocorre no Vertex AI. Os resultados são armazenados no BigQuery.
Para os modelos Gemini suportados, pode usar o débito aprovisionado do Vertex AI para fornecer um débito elevado consistente para pedidos. Para mais informações, consulte o artigo Use o débito aprovisionado da Vertex AI.
Gere incorporações
Uma incorporação é um vetor numérico de alta dimensão que representa uma determinada entidade, como um fragmento de texto ou um ficheiro de áudio. A geração de incorporações permite-lhe captar a semântica dos seus dados de uma forma que facilita o raciocínio e a comparação dos dados.
Seguem-se alguns exemplos de utilização comuns para a geração de incorporações:
- Usar a geração aumentada de recuperação (RAG) para aumentar as respostas do modelo a consultas dos utilizadores, referenciando dados adicionais de uma fonte fidedigna. A RAG oferece uma melhor precisão factual e consistência das respostas, e também oferece acesso a dados mais recentes do que os dados de preparação do modelo.
- Realizar pesquisa multimodal. Por exemplo, usar a entrada de texto para pesquisar imagens.
- Realizar uma pesquisa semântica para encontrar itens semelhantes para recomendações, substituição e eliminação de duplicados de registos.
- Criar incorporações para usar com um modelo k-means para clustering.
Para mais informações sobre como gerar incorporações e usá-las para realizar estas tarefas, consulte a Introdução às incorporações e à pesquisa vetorial.
Funções de IA geridas
As funções de IA geridas são criadas especificamente para automatizar tarefas de rotina, como a classificação, a ordenação ou a filtragem. Estas funções usam o Gemini e não requerem personalização. O BigQuery
usa a engenharia de comandos e seleciona o modelo e os parâmetros adequados a usar
para a tarefa específica de modo a otimizar a qualidade e a consistência dos seus resultados.
Cada função devolve um valor escalar, como BOOL, FLOAT64 ou STRING, e não inclui informações de estado adicionais do modelo.
As seguintes funções de IA geridas estão disponíveis:
AI.IF: Filtre texto ou dados multimodaais, como numa cláusulaWHEREouJOIN, com base num comando. Por exemplo, pode filtrar as descrições dos produtos por aquelas que descrevem um artigo que seria um bom presente.AI.SCORE: Classifique as entradas com base num comando para classificar as linhas por qualidade, semelhança ou outros critérios. Pode usar esta função numa cláusulaORDER BYpara extrair os K principais itens de acordo com a pontuação. Por exemplo, pode encontrar as 10 críticas de utilizadores mais positivas ou negativas de um produto.AI.CLASSIFY: Classificar texto em categorias definidas pelo utilizador. Pode usar esta função numa cláusulaGROUP BYpara agrupar as entradas de acordo com as categorias que definir. Por exemplo, pode classificar os pedidos de apoio técnico consoante estejam relacionados com a faturação, o envio, a qualidade do produto ou outra situação.
Para um tutorial que mostra exemplos de como usar estas funções, consulte o artigo Realize uma análise semântica com funções de IA geridas.
Para um tutorial do bloco de notas que mostra como usar funções de IA geridas e de uso geral, consulte o artigo Análise semântica com funções de IA.
Localizações
As localizações suportadas para a geração de texto e os modelos de incorporação variam consoante o tipo e a versão do modelo que usa. Para mais informações, consulte o artigo Localizações.
Preços
São-lhe cobrados os recursos de computação que usa para executar consultas em modelos. Os modelos remotos fazem chamadas aos modelos da Vertex AI, pelo que as consultas em relação a modelos remotos também incorrem em cobranças da Vertex AI.
Para mais informações, consulte os preços do BigQuery ML.
Monitorize os custos
As funções de IA generativa no BigQuery funcionam através do envio de pedidos ao Vertex AI, o que pode gerar custos. Para acompanhar os custos do Vertex AI incorridos por uma tarefa que executa no BigQuery, siga estes passos:
- Veja os seus relatórios de faturação no Cloud Billing.
Use filtros para refinar os resultados.
Para serviços, selecione Vertex AI.
Para ver os custos de uma tarefa específica, filtre por etiqueta.
Defina a chave como
bigquery_job_id_prefixe o valor como o ID da tarefa da sua tarefa. Se o ID da tarefa tiver mais de 63 carateres, use apenas os primeiros 63 carateres. Se o ID do trabalho contiver carateres em maiúsculas, altere-os para minúsculas. Em alternativa, pode associar trabalhos a uma etiqueta personalizada para os procurar mais tarde.
Algumas cobranças podem demorar até 24 horas a aparecer na faturação na nuvem.
O que se segue?
- Para uma introdução à IA e ao ML no BigQuery, consulte o artigo Introdução à IA e ao ML no BigQuery.
- Para mais informações sobre a realização de inferências sobre modelos de aprendizagem automática, consulte a Vista geral da inferência de modelos.
- Para mais informações sobre as declarações e as funções SQL suportadas para modelos de IA generativa, consulte o artigo Percursos do utilizador completos para modelos de IA generativa.