Treine e use seus próprios modelos

Esta página oferece uma visão geral do fluxo de trabalho para treinar e usar seus próprios modelos de machine learning (ML) na Agent Platform. A Agent Platform oferece um espectro de métodos de treinamento projetados para atender às suas necessidades, desde totalmente automatizados até totalmente personalizados.

  • AutoML: crie modelos de alta qualidade com o mínimo de esforço técnico usando os recursos automatizados de ML do Google.
  • Treinamento sem servidor da Gemini Enterprise Agent Platform: execute seu código de treinamento personalizado em um ambiente totalmente gerenciado e sob demanda sem se preocupar com a infraestrutura.
  • Clusters de treinamento da Gemini Enterprise Agent Platform: execute jobs de treinamento de grande escala e alto desempenho em um cluster dedicado de aceleradores reservado para seu uso exclusivo.
  • Ray na plataforma de agentes: dimensione aplicativos Python e cargas de trabalho de ML usando o framework Ray de código aberto em um serviço gerenciado.

Se precisar de ajuda para decidir qual desses métodos usar, consulte Escolher um método de treinamento.

AutoML

Com o AutoML na Gemini Enterprise Agent Platform, você cria um modelo de ML sem código com base nos dados de treinamento fornecidos. O AutoML pode automatizar tarefas como preparação de dados, seleção de modelos, ajuste de hiperparâmetros e implantação para vários tipos de dados e tarefas de previsão, o que pode tornar o ML mais acessível para uma ampla variedade de usuários.

Tipos de modelos que você pode criar usando o AutoML

Os tipos de modelo que você pode criar dependem do tipo de dados que você tem. A plataforma de agentes do Gemini Enterprise oferece soluções do AutoML para os seguintes tipos de dados e objetivos de modelo:

Tipo de dado Objetivos compatíveis
Dados de imagem Classificação, detecção de objetos.
Dados em tabela Classificação/regressão, previsão.

Para saber mais sobre o AutoML, consulte Visão geral do treinamento do AutoML.

Executar código de treinamento personalizado na Agent Platform

Se o AutoML não atender às suas necessidades, forneça seu próprio código de treinamento e execute-o na infraestrutura gerenciada da plataforma de agentes. Isso oferece controle total e flexibilidade sobre a arquitetura e a lógica de treinamento do modelo, permitindo que você use qualquer framework de ML que escolher.

A Agent Platform oferece dois modos principais para executar seu código de treinamento personalizado: um ambiente sem servidor e sob demanda ou um cluster dedicado e reservado.

Treinamento sem servidor da Gemini Enterprise Agent Platform

O treinamento sem servidor é um serviço totalmente gerenciado que permite executar seu aplicativo de treinamento personalizado sem provisionar ou gerenciar nenhuma infraestrutura. Você empacota seu código em um contêiner, define as especificações da máquina (incluindo CPUs e GPUs) e o envia como um CustomJob.

O Agent Platform cuida do resto:

  • Provisionamento dos recursos de computação durante a duração do job.
  • Executando o código de treinamento.
  • Excluir os recursos após a conclusão do job.

Esse modelo de pagamento por uso e sob demanda é ideal para experimentação, prototipagem rápida e jobs de produção que não exigem capacidade garantida e instantânea.

Para saber mais, consulte Criar um job personalizado de treinamento sem servidor

Clusters de treinamento da Gemini Enterprise Agent Platform

Para treinamento em larga escala, de alto desempenho e essencial, é possível reservar um cluster dedicado de aceleradores. Isso garante a capacidade e elimina as filas, garantindo que seus jobs comecem imediatamente.

Embora você tenha uso exclusivo desses recursos, a Agent Platform ainda processa a sobrecarga operacional do gerenciamento do cluster, incluindo manutenção de hardware e aplicação de patch no SO. Essa abordagem de "servidor gerenciado" oferece a potência de um cluster dedicado sem a complexidade do gerenciamento.

Ray na Vertex AI

O Ray na Vertex AI é um serviço que permite usar o framework de código aberto Ray para escalonar aplicativos de IA e Python diretamente na plataforma de agentes. O Ray foi projetado para fornecer a infraestrutura de computação distribuída e processamento paralelo para seu fluxo de trabalho de ML.

O Ray na Vertex AI oferece um ambiente gerenciado para executar aplicativos distribuídos usando o framework Ray, oferecendo escalonabilidade e integração com serviços do Google Cloud .

Para saber mais sobre o Ray na Vertex AI, consulte Visão geral do Ray na Vertex AI.