Introdução à IA no BigQuery

O BigQuery oferece vários recursos de IA que permitem fazer o seguinte:

  • Fazer machine learning (ML) preditivo.
  • Execute inferências em modelos de linguagem grandes (LLMs), como o Gemini.
  • Crie aplicativos usando embeddings e pesquisa vetorial.
  • Use agentes integrados para ajudar na programação.
  • Criar pipelines de dados.
  • Acessar a funcionalidade do BigQuery com ferramentas de agente.

Machine learning

Com o BigQuery ML, é possível treinar, avaliar e executar inferências em modelos para tarefas como previsão de série temporal, detecção de anomalias, classificação, regressão, clustering, redução de dimensionalidade e recomendações.

É possível trabalhar com os recursos do BigQuery ML usando o consoleGoogle Cloud , a ferramenta de linha de comando bq, a API REST ou os notebooks do Colab Enterprise. Como o BigQuery ML permite que os profissionais de SQL usem ferramentas e habilidades de SQL para criar e avaliar modelos, ele democratiza o ML e acelera o desenvolvimento de modelos ao trazer o ML para os dados, em vez de exigir a movimentação de dados. É possível usar o BigQuery ML para ajudar com os seguintes tipos de tarefas de ML:

Para saber mais, consulte a Introdução ao ML no BigQuery.

Funções de IA

O BigQuery oferece várias funções SQL que podem ser usadas para tarefas de IA, como geração de texto, análise de dados de texto ou não estruturados e tradução. Essas funções acessam o Gemini e modelos de LLM parceiros disponíveis na Gemini Enterprise Agent Platform, nas APIs da IA do Google Cloud ou em modelos integrados do BigQuery para realizar essas tarefas.

Há várias categorias de funções de IA:

Para mais informações, consulte Visão geral das soluções específicas para tarefas.

O BigQuery oferece várias funções e recursos de pesquisa para ajudar você a encontrar dados específicos ou descobrir semelhanças entre eles, incluindo dados multimodais.

  • Pesquisa de texto. Use a função SEARCH para fazer uma pesquisa tokenizada em texto não estruturado ou dados JSON semiestruturados. Para melhorar o desempenho da pesquisa, crie um índice de pesquisa, que permite ao BigQuery otimizar consultas que usam a função SEARCH, além de outras funções e operadores. Para mais informações, consulte Pesquisar dados indexados.

  • Geração de embeddings. Os embeddings são vetores numéricos de alta dimensão que representam entidades como texto ou imagens e geralmente são gerados por modelos de ML. É possível gerar embeddings multimodais usando modelos fornecidos ou hospedados na Agent Platform ou importados e executados no BigQuery.

    Também é possível fazer com que o BigQuery mantenha automaticamente uma coluna de incorporações ativando a geração autônoma de incorporações (prévia).

  • Pesquisa vetorial. Use a função VECTOR_SEARCH para pesquisar embeddings e encontrar itens semanticamente semelhantes. Você pode usar a função AI.SEARCH (Visualização) para pesquisar em tabelas com a geração autônoma de incorporações ativada. Você pode melhorar o desempenho da pesquisa vetorial criando um índice vetorial, que usa técnicas de pesquisa de vizinho mais próximo aproximado para fornecer resultados mais rápidos e aproximados.

    Casos de uso comuns para pesquisa vetorial incluem pesquisa semântica, recomendação e geração aumentada por recuperação (RAG). Para mais informações, consulte Introdução à pesquisa de vetor.

Recursos de IA assistiva

Os recursos de assistência com tecnologia de IA no BigQuery, chamados coletivamente de Gemini no BigQuery, ajudam você a descobrir, preparar, consultar e visualizar seus dados.

  • Insights de dados. Gerar perguntas em linguagem natural sobre seus dados, além das consultas SQL para responder a essas perguntas.
  • Preparação de dados. Gerar recomendações contextuais para limpar, transformar e enriquecer seus dados.
  • Assistente de código em SQL. Gerar, completar e explicar consultas SQL.
  • Assistente de código Python. Gerar, completar e explicar código Python, incluindo PySpark e BigQuery DataFrames.
  • Tela de dados. Consulte seus dados usando linguagem natural, visualize os resultados com gráficos e faça perguntas complementares.
  • Tradutor de SQL. Crie regras de conversão de SQL aprimoradas com o Gemini para ajudar a migrar consultas escritas em um dialeto diferente para o GoogleSQL.

Agentes

Os agentes são ferramentas de software que usam a IA para concluir tarefas em seu nome. É possível usar agentes integrados ou criar seus próprios agentes para ajudar você a processar, gerenciar, analisar e visualizar seus dados:

  • Use o Agente de Ciência de Dados para automatizar a análise exploratória de dados, o tratamento de dados, as tarefas de ML e os insights de visualização em um notebook do Colab Enterprise.

  • Use o agente de engenharia de dados para criar, modificar e gerenciar pipelines de dados para carregar e processar dados no BigQuery. É possível usar comandos em linguagem natural para gerar pipelines de dados de várias fontes ou adaptar os pipelines atuais às suas necessidades de engenharia de dados.

  • Use o agente das Análises de conversação para conversar com seus dados usando linguagem natural. Ele consiste em uma ou mais fontes de dados e um conjunto de instruções específicas para o caso de uso para processar esses dados. A análise de conversas é compatível com o uso de algumas funções do BigQuery ML.

  • Use a CLI do Gemini para interagir com os dados do BigQuery no terminal usando comandos de linguagem natural.

  • Crie usando a caixa de ferramentas do MCP de código aberto ou as ferramentas do ADK para um desenvolvimento rápido e iterativo de agentes.

A seguir