Esta página oferece uma visão geral do fluxo de trabalho para treinamento e uso dos seus próprios modelos de machine learning (ML) na Agent Platform. A Agent Platform oferece um espectro de métodos de treinamento projetados para atender às suas necessidades, desde totalmente automatizados até totalmente personalizados.
- AutoML: crie modelos de alta qualidade com o mínimo de esforço técnico aproveitando os recursos automatizados de ML do Google.
- Treinamento sem servidor da plataforma de agentes do Gemini Enterprise: execute seu código de treinamento personalizado em um ambiente totalmente gerenciado e sob demanda, sem se preocupar com a infraestrutura.
- Clusters de treinamento da plataforma de agentes do Gemini Enterprise: execute jobs de treinamento de alta performance e em grande escala em um cluster dedicado de aceleradores reservados para seu uso exclusivo.
- Ray na Agent Platform: dimensione aplicativos Python e cargas de trabalho de ML usando o framework de código aberto Ray em um serviço gerenciado.
Se precisar de ajuda para decidir qual desses métodos usar, consulte Escolher um método de treinamento.
AutoML
O AutoML na Gemini Enterprise Agent Platform permite criar um modelo de ML sem código com base nos dados de treinamento fornecidos. O AutoML pode automatizar tarefas como preparação de dados, seleção de modelos, ajuste de hiperparâmetros e implantação para vários tipos de dados e tarefas de previsão, o que pode tornar o ML mais acessível para uma ampla variedade de usuários.
Tipos de modelos que você pode criar usando o AutoML
Os tipos de modelo que você pode criar dependem do tipo de dados que você tem. A plataforma de agentes do Gemini Enterprise oferece soluções do AutoML para os seguintes tipos de dados e objetivos de modelo:
| Tipo de dado | Objetivos compatíveis |
|---|---|
| Dados de imagem | Classificação, detecção de objetos. |
| Dados em tabela | Classificação/regressão, previsão. |
Para saber mais sobre o AutoML, consulte Visão geral do treinamento do AutoML.
Executar código de treinamento personalizado na Agent Platform
Se o AutoML não atender às suas necessidades, você poderá fornecer seu próprio código de treinamento e executá-lo na infraestrutura gerenciada da Agent Platform. Isso oferece controle total e flexibilidade sobre a arquitetura e a lógica de treinamento do modelo, permitindo que você use qualquer framework de ML.
A Agent Platform oferece dois modos principais para executar seu código de treinamento personalizado: um ambiente sem servidor e sob demanda ou um cluster dedicado e reservado.
Treinamento sem servidor da Gemini Enterprise Agent Platform
O treinamento sem servidor é um serviço totalmente gerenciado que permite executar seu aplicativo de treinamento personalizado sem provisionar ou gerenciar nenhuma infraestrutura.
Você empacota o código em um contêiner, define as especificações da máquina (incluindo CPUs e GPUs) e o envia como um CustomJob.
A Agent Platform cuida do resto:
- Provisionamento dos recursos de computação durante o job.
- Execução do código de treinamento.
- Exclusão dos recursos após a conclusão do job.
Esse modelo de pagamento por uso e sob demanda é ideal para experimentação, prototipagem rápida e jobs de produção que não exigem capacidade instantânea garantida.
Para saber mais, consulte Criar um job personalizado de treinamento sem servidor
Clusters de treinamento da plataforma de agentes do Gemini Enterprise
Para treinamento de alta performance, em grande escala e de missão crítica, você pode reservar um cluster dedicado de aceleradores. Isso oferece capacidade garantida e elimina filas, garantindo que seus jobs comecem imediatamente.
Embora você tenha uso exclusivo desses recursos, a Agent Platform ainda lida com a sobrecarga operacional do gerenciamento do cluster, incluindo manutenção de hardware e aplicação de patches do SO. Essa abordagem "com servidor gerenciado" oferece o poder de um cluster dedicado sem a complexidade do gerenciamento.
Ray na Vertex AI
O Ray na Vertex AI é um serviço que permite usar o framework de código aberto Ray para dimensionar aplicativos de IA e Python diretamente na Agent Platform. O Ray foi projetado para fornecer a infraestrutura de computação distribuída e processamento paralelo para seu fluxo de trabalho de ML.
O Ray na Vertex AI oferece um ambiente gerenciado para executar aplicativos distribuídos usando o framework Ray, oferecendo escalonabilidade e integração com Google Cloud serviços.
Para saber mais sobre o Ray na Vertex AI, consulte Visão geral do Ray na Vertex AI.