Introdução à IA no BigQuery

O BigQuery oferece vários recursos de IA que permitem fazer o seguinte:

  • Fazer machine learning (ML) preditivo.
  • Executar inferência em modelos de linguagem grandes (LLMs) como o Gemini.
  • Crie aplicativos usando embeddings e pesquisa vetorial.
  • Use agentes integrados para ajudar na programação.
  • Criar pipelines de dados.
  • Acesse a funcionalidade do BigQuery com ferramentas de agente.

Machine learning

Com o BigQuery ML, é possível treinar, avaliar e executar inferências em modelos para tarefas como previsão de série temporal, detecção de anomalias, classificação, regressão, clustering, redução de dimensionalidade e recomendações.

É possível trabalhar com os recursos do BigQuery ML usando o consoleGoogle Cloud , a ferramenta de linha de comando bq, a API REST ou os notebooks do Colab Enterprise. Como o BigQuery ML permite que os profissionais de SQL usem ferramentas e habilidades de SQL atuais para criar e avaliar modelos, ele democratiza o ML e acelera o desenvolvimento de modelos ao trazer o ML para os dados, em vez de exigir a movimentação de dados. É possível usar o BigQuery ML para ajudar com os seguintes tipos de tarefas de ML:

Para saber mais, consulte a Introdução ao ML no BigQuery.

Funções de IA

O BigQuery oferece várias funções SQL que podem ser usadas para tarefas de IA, como geração de texto, análise de texto ou dados não estruturados e tradução. Essas funções acessam modelos de LLM do Gemini e de parceiros disponíveis na Vertex AI, nas APIs do Cloud AI ou nos modelos integrados do BigQuery para realizar essas tarefas.

Há várias categorias de funções de IA:

Para mais informações, consulte Visão geral das soluções específicas para tarefas.

O BigQuery oferece várias funções e recursos de pesquisa para ajudar você a encontrar dados específicos ou descobrir semelhanças entre eles, incluindo dados multimodais.

  • Pesquisa de texto. Use a função SEARCH para fazer uma pesquisa tokenizada em texto não estruturado ou dados JSON semiestruturados. Para melhorar o desempenho da pesquisa, crie um índice de pesquisa, que permite ao BigQuery otimizar consultas que usam a função SEARCH, além de outras funções e operadores. Para mais informações, consulte Pesquisar dados indexados.

  • Geração de embeddings. Os embeddings são vetores numéricos de alta dimensão que representam entidades como texto ou imagens e geralmente são gerados por modelos de ML. É possível gerar embeddings multimodais usando modelos fornecidos ou hospedados na Vertex AI ou importados e executados no BigQuery.

    Também é possível fazer com que o BigQuery mantenha automaticamente uma coluna de incorporações ativando a geração autônoma de incorporações (prévia).

  • Pesquisa vetorial. Use a função VECTOR_SEARCH para pesquisar embeddings e encontrar itens semanticamente semelhantes. Você pode usar a função AI.SEARCH (Visualização) para pesquisar em tabelas com a geração autônoma de incorporações ativada. Você pode melhorar o desempenho da pesquisa vetorial criando um índice vetorial, que usa técnicas de pesquisa de vizinho mais próximo aproximado para fornecer resultados mais rápidos e aproximados.

    Casos de uso comuns para pesquisa vetorial incluem pesquisa semântica, recomendação e geração aumentada de recuperação (RAG). Para mais informações, consulte Introdução à pesquisa de vetor.

Recursos de IA assistiva

Os recursos de assistência com tecnologia de IA no BigQuery, chamados coletivamente de Gemini no BigQuery, ajudam você a descobrir, preparar, consultar e visualizar seus dados.

  • Insights de dados Gerar perguntas em linguagem natural sobre seus dados, além das consultas SQL para responder a essas perguntas.
  • Preparação de dados. Gerar recomendações contextuais para limpar, transformar e enriquecer seus dados.
  • Assistente de código em SQL. Gerar, completar e explicar consultas SQL.
  • Assistente de código Python. Gerar, completar e explicar código Python, incluindo PySpark e DataFrames do BigQuery.
  • Tela de dados. Consulte seus dados usando linguagem natural, visualize os resultados com gráficos e faça perguntas complementares.
  • Tradutor de SQL. Crie regras de conversão de SQL aprimoradas com o Gemini para ajudar a migrar consultas escritas em um dialeto diferente para o GoogleSQL.

Agentes

Os agentes são ferramentas de software que podem usar a IA para concluir tarefas em seu nome. É possível usar agentes integrados ou criar seus próprios agentes para ajudar você a processar, gerenciar, analisar e visualizar seus dados:

  • Use o Agente de Ciência de Dados para automatizar a análise exploratória de dados, o processamento de dados, as tarefas de ML e os insights de visualização em um notebook do Colab Enterprise.

  • Use o Agente de engenharia de dados para criar, modificar e gerenciar pipelines de dados para carregar e processar dados no BigQuery. É possível usar comandos de linguagem natural para gerar pipelines de dados de várias fontes ou adaptar os pipelines atuais às suas necessidades de engenharia de dados.

  • Use a CLI do Gemini para interagir com os dados do BigQuery no terminal usando comandos de linguagem natural.

  • Use a MCP Toolbox para conectar sua própria ferramenta de IA ao BigQuery e interagir com seus dados.

A seguir