Treinar um modelo usando a plataforma de agente do Gemini Enterprise e o SDK do Python

Este tutorial é um guia completo que mostra como usar o SDK da plataforma de agentes para Python para criar um modelo treinado de maneira personalizada. Você executa o código em um arquivo de notebook (IPYNB) que usa um contêiner do Docker para treinar e criar o modelo. Este tutorial é destinado a cientistas de dados iniciantes na plataforma de agentes do Gemini Enterprise e familiarizados com notebooks, Python e o fluxo de trabalho de machine learning (ML).

O processo começa usando o console Google Cloud para criar o projeto que contém seu trabalho. No projeto, use o Vertex AI Workbench para criar um notebook do Jupyter. O ambiente do notebook é onde você executa o código que faz o download e prepara um conjunto de dados e usa o conjunto de dados para criar e treinar um modelo. Ao final do tutorial, o modelo treinado gera previsões.

O objetivo deste tutorial é mostrar todas as etapas necessárias para criar previsões em menos de uma hora. O conjunto de dados usado é relativamente pequeno para não demorar muito para treinar o modelo. Quando terminar, você poderá aplicar o que aprender a conjuntos de dados maiores. Quanto maior o conjunto de dados, mais precisas serão suas previsões.

Etapas do tutorial

  1. Pré-requisitos: crie sua conta e seu projeto do Google Cloud.

  2. Criar um notebook: crie e prepare um notebook do Jupyter e o ambiente dele. Use o notebook para executar o código que cria seu conjunto de dados, cria e treina seu modelo e gera as previsões.

  3. Criar um conjunto de dados: faça o download de um conjunto de dados do BigQuery disponível publicamente e use-o para criar um conjunto de dados tabular da plataforma de agente do Gemini Enterprise. O conjunto de dados contém os dados que você usa para treinar seu modelo.

  4. Criar um script de treinamento: crie um script Python que você transmite para o job de treinamento. O script é executado quando o job de treinamento treina e cria seu modelo.

  5. Treinar um modelo: use seu conjunto de dados tabular para treinar e implantar um modelo. Use o modelo para criar as previsões.

  6. Fazer previsões: use seu modelo para criar previsões. Esta seção também mostra como excluir recursos criados ao executar este tutorial para que não haja cobranças desnecessárias.

O que você realiza

Confira neste tutorial como usar o SDK da plataforma de agentes para Python para fazer o seguinte:

  • Criar um bucket do Cloud Storage para armazenar um conjunto de dados
  • Pré-processar dados para treinamento
  • Usar os dados processados para criar um conjunto de dados no BigQuery
  • Usar o conjunto de dados do BigQuery para criar um conjunto de dados tabular da plataforma de agentes do Gemini Enterprise
  • Criar e treinar um modelo treinado de maneira personalizada
  • Implantar o modelo treinado de maneira personalizada em um endpoint
  • Gerar uma previsão
  • Remover a implantação do modelo
  • Excluir todos os recursos criados no tutorial para que não haja cobranças

Recursos faturáveis usados

Neste tutorial, usamos recursos faturáveis associados aos serviços da plataforma de agentes do Gemini Enterprise, do BigQuery e do Cloud Storage Google Cloud . Se você não tem experiência com o Google Cloud, talvez possa usar um ou mais desses serviços sem custos. A plataforma de agentes do Gemini Enterprise oferece US $300 em créditos para novos clientes, e o Cloud Storage e o BigQuery têm níveis sem custo financeiro. Para ver mais informações, consulte os seguintes tópicos:

Para evitar outras cobranças, a etapa final deste tutorial mostra como remover todos os recursos faturáveis do Google Cloud que você criou.