Introdução à IA no BigQuery
O BigQuery oferece vários recursos de IA que permitem fazer o seguinte:
- Fazer machine learning (ML) preditivo.
- Executar inferência em modelos de linguagem grandes (LLMs) como o Gemini.
- Crie aplicativos usando embeddings e pesquisa vetorial.
- Use agentes integrados para ajudar na programação.
- Criar pipelines de dados.
- Acesse a funcionalidade do BigQuery com ferramentas de agente.
Machine learning
Com o BigQuery ML, é possível treinar, avaliar e executar inferências em modelos para tarefas como previsão de série temporal, detecção de anomalias, classificação, regressão, clustering, redução de dimensionalidade e recomendações.
É possível trabalhar com os recursos do BigQuery ML usando o consoleGoogle Cloud , a ferramenta de linha de comando bq, a API REST ou os notebooks do Colab Enterprise. Como o BigQuery ML permite que os profissionais de SQL usem ferramentas e habilidades de SQL atuais para criar e avaliar modelos, ele democratiza o ML e acelera o desenvolvimento de modelos ao trazer o ML para os dados, em vez de exigir a movimentação de dados. É possível usar o BigQuery ML para ajudar com os seguintes tipos de tarefas de ML:
- Crie e execute modelos de ML usando consultas do GoogleSQL.
- Crie notebooks do Colab Enterprise para realizar fluxos de trabalho de ML. Com os notebooks, você usa SQL e Python de forma intercambiável e qualquer biblioteca de Python de IA ou ML para seu desenvolvimento.
- Entenda os resultados dos seus modelos preditivos de ML com a Explainable AI.
- Use os modelos
TimesFM,ARIMA_PLUSeARIMA_PLUS_XREGpara realizar previsões e detecção de anomalias em dados de série temporal. - Gere insights sobre mudanças nas principais métricas dos seus dados multidimensionais com a análise de contribuição.
Para saber mais, consulte a Introdução ao ML no BigQuery.
Funções de IA
O BigQuery oferece várias funções SQL que podem ser usadas para tarefas de IA, como geração de texto, análise de texto ou dados não estruturados e tradução. Essas funções acessam modelos de LLM do Gemini e de parceiros disponíveis na Vertex AI, nas APIs do Cloud AI ou nos modelos integrados do BigQuery para realizar essas tarefas.
Há várias categorias de funções de IA:
Funções da IA generativa. Essas funções ajudam você a realizar tarefas como geração de conteúdo, análise, resumo, extração de dados estruturados, classificação, geração de incorporações e enriquecimento de dados. Há dois tipos de funções de IA generativa:
- Funções de IA de uso geral oferecem controle total e transparência na escolha do modelo, do comando e dos parâmetros a serem usados.
- As funções gerenciadas de IA oferecem uma sintaxe simplificada para tarefas rotineiras, como filtragem, classificação e classificação. O BigQuery escolhe um modelo para você, otimizado para custo e qualidade.
Funções específicas para tarefas. Essas funções ajudam você a usar as APIs de IA do Cloud para tarefas como as seguintes:
Para mais informações, consulte Visão geral das soluções específicas para tarefas.
Pesquisar
O BigQuery oferece várias funções e recursos de pesquisa para ajudar você a encontrar dados específicos ou descobrir semelhanças entre eles, incluindo dados multimodais.
Pesquisa de texto. Use a função
SEARCHpara fazer uma pesquisa tokenizada em texto não estruturado ou dadosJSONsemiestruturados. Para melhorar o desempenho da pesquisa, crie um índice de pesquisa, que permite ao BigQuery otimizar consultas que usam a funçãoSEARCH, além de outras funções e operadores. Para mais informações, consulte Pesquisar dados indexados.Geração de embeddings. Os embeddings são vetores numéricos de alta dimensão que representam entidades como texto ou imagens e geralmente são gerados por modelos de ML. É possível gerar embeddings multimodais usando modelos fornecidos ou hospedados na Vertex AI ou importados e executados no BigQuery.
Também é possível fazer com que o BigQuery mantenha automaticamente uma coluna de incorporações ativando a geração autônoma de incorporações (prévia).
Pesquisa vetorial. Use a função
VECTOR_SEARCHpara pesquisar embeddings e encontrar itens semanticamente semelhantes. Você pode usar a funçãoAI.SEARCH(Visualização) para pesquisar em tabelas com a geração autônoma de incorporações ativada. Você pode melhorar o desempenho da pesquisa vetorial criando um índice vetorial, que usa técnicas de pesquisa de vizinho mais próximo aproximado para fornecer resultados mais rápidos e aproximados.Casos de uso comuns para pesquisa vetorial incluem pesquisa semântica, recomendação e geração aumentada de recuperação (RAG). Para mais informações, consulte Introdução à pesquisa de vetor.
Recursos de IA assistiva
Os recursos de assistência com tecnologia de IA no BigQuery, chamados coletivamente de Gemini no BigQuery, ajudam você a descobrir, preparar, consultar e visualizar seus dados.
- Insights de dados Gerar perguntas em linguagem natural sobre seus dados, além das consultas SQL para responder a essas perguntas.
- Preparação de dados. Gerar recomendações contextuais para limpar, transformar e enriquecer seus dados.
- Assistente de código em SQL. Gerar, completar e explicar consultas SQL.
- Assistente de código Python. Gerar, completar e explicar código Python, incluindo PySpark e DataFrames do BigQuery.
- Tela de dados. Consulte seus dados usando linguagem natural, visualize os resultados com gráficos e faça perguntas complementares.
- Tradutor de SQL. Crie regras de conversão de SQL aprimoradas com o Gemini para ajudar a migrar consultas escritas em um dialeto diferente para o GoogleSQL.
Agentes
Os agentes são ferramentas de software que podem usar a IA para concluir tarefas em seu nome. É possível usar agentes integrados ou criar seus próprios agentes para ajudar você a processar, gerenciar, analisar e visualizar seus dados:
Use o Agente de Ciência de Dados para automatizar a análise exploratória de dados, o processamento de dados, as tarefas de ML e os insights de visualização em um notebook do Colab Enterprise.
Use o Agente de engenharia de dados para criar, modificar e gerenciar pipelines de dados para carregar e processar dados no BigQuery. É possível usar comandos de linguagem natural para gerar pipelines de dados de várias fontes ou adaptar os pipelines atuais às suas necessidades de engenharia de dados.
Use a CLI do Gemini para interagir com os dados do BigQuery no terminal usando comandos de linguagem natural.
Use a MCP Toolbox para conectar sua própria ferramenta de IA ao BigQuery e interagir com seus dados.
A seguir
- Para mais informações sobre ML, consulte Introdução ao ML no BigQuery.
- Para mais informações sobre as funções de IA generativa em SQL, consulte Visão geral da IA generativa.
- Para mais informações sobre como pesquisar seus dados, consulte Pesquisar dados indexados e Introdução à pesquisa de vetores.
- Para mais informações sobre os recursos de IA assistiva, consulte Gemini no BigQuery.
- Para mais informações sobre como usar agentes com o BigQuery, consulte Usar o BigQuery com a MCP, a CLI do Gemini e outros agentes.