Introdução à IA no BigQuery
O BigQuery oferece vários recursos de IA que permitem fazer o seguinte:
- Fazer machine learning (ML) preditivo.
- Execute inferências em modelos de linguagem grandes (LLMs), como o Gemini.
- Crie aplicativos usando embeddings e pesquisa vetorial.
- Use agentes integrados para ajudar na programação.
- Criar pipelines de dados.
- Acessar a funcionalidade do BigQuery com ferramentas de agente.
Machine learning
Com o BigQuery ML, é possível treinar, avaliar e executar inferências em modelos para tarefas como previsão de série temporal, detecção de anomalias, classificação, regressão, clustering, redução de dimensionalidade e recomendações.
É possível trabalhar com os recursos do BigQuery ML usando o consoleGoogle Cloud , a ferramenta de linha de comando bq, a API REST ou os notebooks do Colab Enterprise. Como o BigQuery ML permite que os profissionais de SQL usem ferramentas e habilidades de SQL para criar e avaliar modelos, ele democratiza o ML e acelera o desenvolvimento de modelos ao trazer o ML para os dados, em vez de exigir a movimentação de dados. É possível usar o BigQuery ML para ajudar com os seguintes tipos de tarefas de ML:
- Crie e execute modelos de ML usando consultas do GoogleSQL.
- Crie notebooks do Colab Enterprise para realizar fluxos de trabalho de ML. Com os notebooks, você usa SQL e Python de forma intercambiável e qualquer biblioteca de Python de IA ou ML para seu desenvolvimento.
- Entenda os resultados dos seus modelos preditivos de ML com a IA explicável.
- Use os modelos
TimesFM,ARIMA_PLUSeARIMA_PLUS_XREGpara realizar previsões e detecção de anomalias em dados de série temporal. - Gere insights sobre mudanças nas principais métricas dos seus dados multidimensionais com a análise de contribuição.
Para saber mais, consulte a Introdução ao ML no BigQuery.
Funções de IA
O BigQuery oferece várias funções SQL que podem ser usadas para tarefas de IA, como geração de texto, análise de dados de texto ou não estruturados e tradução. Essas funções acessam o Gemini e modelos de LLM parceiros disponíveis na Gemini Enterprise Agent Platform, nas APIs da IA do Google Cloud ou em modelos integrados do BigQuery para realizar essas tarefas.
Há várias categorias de funções de IA:
Funções da IA generativa. Essas funções ajudam a realizar tarefas como geração de conteúdo, análise, resumo, extração de dados estruturados, classificação, geração de embeddings e aprimoramento de dados. Há dois tipos de funções de IA generativa:
- Funções de IA de uso geral oferecem controle total e transparência na escolha do modelo, do comando e dos parâmetros a serem usados.
- As funções gerenciadas de IA oferecem uma sintaxe simplificada para tarefas rotineiras, como filtragem, classificação e classificação. O BigQuery pode escolher um modelo para você e otimizar o custo e a qualidade.
Funções específicas para tarefas. Essas funções ajudam você a usar as APIs de IA do Google Cloud para tarefas como as seguintes:
Para mais informações, consulte Visão geral das soluções específicas para tarefas.
Pesquisar
O BigQuery oferece várias funções e recursos de pesquisa para ajudar você a encontrar dados específicos ou descobrir semelhanças entre eles, incluindo dados multimodais.
Pesquisa de texto. Use a função
SEARCHpara fazer uma pesquisa tokenizada em texto não estruturado ou dadosJSONsemiestruturados. Para melhorar o desempenho da pesquisa, crie um índice de pesquisa, que permite ao BigQuery otimizar consultas que usam a funçãoSEARCH, além de outras funções e operadores. Para mais informações, consulte Pesquisar dados indexados.Geração de embeddings. Os embeddings são vetores numéricos de alta dimensão que representam entidades como texto ou imagens e geralmente são gerados por modelos de ML. É possível gerar embeddings multimodais usando modelos fornecidos ou hospedados na Agent Platform ou importados e executados no BigQuery.
Também é possível fazer com que o BigQuery mantenha automaticamente uma coluna de incorporações ativando a geração autônoma de incorporações (prévia).
Pesquisa vetorial. Use a função
VECTOR_SEARCHpara pesquisar embeddings e encontrar itens semanticamente semelhantes. Você pode usar a funçãoAI.SEARCH(Visualização) para pesquisar em tabelas com a geração autônoma de incorporações ativada. Você pode melhorar o desempenho da pesquisa vetorial criando um índice vetorial, que usa técnicas de pesquisa de vizinho mais próximo aproximado para fornecer resultados mais rápidos e aproximados.Casos de uso comuns para pesquisa vetorial incluem pesquisa semântica, recomendação e geração aumentada por recuperação (RAG). Para mais informações, consulte Introdução à pesquisa de vetor.
Recursos de IA assistiva
Os recursos de assistência com tecnologia de IA no BigQuery, chamados coletivamente de Gemini no BigQuery, ajudam você a descobrir, preparar, consultar e visualizar seus dados.
- Insights de dados. Gerar perguntas em linguagem natural sobre seus dados, além das consultas SQL para responder a essas perguntas.
- Preparação de dados. Gerar recomendações contextuais para limpar, transformar e enriquecer seus dados.
- Assistente de código em SQL. Gerar, completar e explicar consultas SQL.
- Assistente de código Python. Gerar, completar e explicar código Python, incluindo PySpark e BigQuery DataFrames.
- Tela de dados. Consulte seus dados usando linguagem natural, visualize os resultados com gráficos e faça perguntas complementares.
- Tradutor de SQL. Crie regras de conversão de SQL aprimoradas com o Gemini para ajudar a migrar consultas escritas em um dialeto diferente para o GoogleSQL.
Agentes
Os agentes são ferramentas de software que usam a IA para concluir tarefas em seu nome. É possível usar agentes integrados ou criar seus próprios agentes para ajudar você a processar, gerenciar, analisar e visualizar seus dados:
Use o Agente de Ciência de Dados para automatizar a análise exploratória de dados, o tratamento de dados, as tarefas de ML e os insights de visualização em um notebook do Colab Enterprise.
Use o agente de engenharia de dados para criar, modificar e gerenciar pipelines de dados para carregar e processar dados no BigQuery. É possível usar comandos em linguagem natural para gerar pipelines de dados de várias fontes ou adaptar os pipelines atuais às suas necessidades de engenharia de dados.
Use o agente das Análises de conversação para conversar com seus dados usando linguagem natural. Ele consiste em uma ou mais fontes de dados e um conjunto de instruções específicas para o caso de uso para processar esses dados. A análise de conversas é compatível com o uso de algumas funções do BigQuery ML.
Use a CLI do Gemini para interagir com os dados do BigQuery no terminal usando comandos de linguagem natural.
Crie usando a caixa de ferramentas do MCP de código aberto ou as ferramentas do ADK para um desenvolvimento rápido e iterativo de agentes.
A seguir
- Para mais informações sobre ML, consulte Introdução ao ML no BigQuery.
- Para mais informações sobre as funções de IA generativa em SQL, consulte Visão geral da IA generativa.
- Para mais informações sobre como pesquisar seus dados, consulte Pesquisar dados indexados e Introdução à pesquisa de vetores.
- Para mais informações sobre os recursos de IA assistiva, consulte Gemini no BigQuery.
- Para mais informações sobre como usar agentes com o BigQuery, consulte:
- Use o servidor MCP do BigQuery.
- Conecte LLMs ao BigQuery com o MCP usando IDEs como o Antigravity.
- Analisar dados com a CLI do Gemini.