Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Elige un método de entrenamiento sin servidores de Gemini Enterprise Agent Platform

Si escribes tu propio código de entrenamiento en lugar de usar AutoML, existen varias formas de realizar un entrenamiento sin servidores de la plataforma de agentes de Gemini Enterprise que debes tener en cuenta. En este documento, se proporciona una breve descripción general y una comparación de las diferentes formas en las que puedes ejecutar el entrenamiento sin servidores.

Recursos de entrenamiento sin servidores en Agent Platform

Existen tres tipos de recursos de Agent Platform que puedes crear para entrenar modelos personalizados en Agent Platform:

Cuando creas un trabajo personalizado, debes especificar la configuración que Agent Platform necesita para ejecutar tu código de entrenamiento, incluido lo siguiente:

Un grupo de trabajadores para el entrenamiento de nodo único (WorkerPoolSpec) o varios grupos de trabajadores para el entrenamiento distribuido
Configuración opcional para configurar la programación de trabajos (Scheduling), establecer ciertas variables de entorno para tu código de entrenamiento, usar una cuenta de servicio y usar intercambio de tráfico entre redes de VPC

En los grupos de trabajadores, puedes especificar la siguiente configuración:

Tipos de máquinas y aceleradores
Configuración del tipo de código de entrenamiento que ejecuta el grupo de trabajadores: una aplicación de entrenamiento de Python (PythonPackageSpec) o un contenedor personalizado (ContainerSpec).

Los trabajos de ajuste de hiperparámetros tienen parámetros de configuración adicionales, como la métrica. Obtén más información sobre el ajuste de hiperparámetros.

Una canalización de entrenamiento organiza trabajos de entrenamiento sin servidor o trabajos de ajuste de hiperparámetros con pasos adicionales, como cargar un conjunto de datos o subir el modelo a Agent Platform después de que el trabajo de entrenamiento se completa de forma correcta.

Recursos de entrenamiento sin servidores

Para ver las canalizaciones de entrenamiento existentes en tu proyecto, ve a la página Canalizaciones de entrenamiento en la sección Agent Platform de la consola deGoogle Cloud .

Ve a Canalizaciones de entrenamiento

Para ver los trabajos personalizados existentes en tu proyecto, ve a la página Trabajos personalizados.

Ir a Trabajos personalizados

Para ver los trabajos de ajuste de hiperparámetros existentes en tu proyecto, ve a la página Ajuste de hiperparámetros.

Ir a Ajuste de hiperparámetros

Contenedores compilados previamente y personalizados

Antes de enviar un trabajo de entrenamiento sin servidores, un trabajo de ajuste de hiperparámetros o una canalización de entrenamiento a Agent Platform, debes crear una aplicación de entrenamiento de Python o un contenedor personalizado para definir el código de entrenamiento y las dependencias que deseas ejecutar en Agent Platform. Si creas una aplicación de entrenamiento de Python mediante TensorFlow, scikit-learn o XGBoost, puedes usar nuestros contenedores compilados con anterioridad para ejecutar tu código. Si no estás seguro de cuál de estas opciones elegir, consulta los requisitos de código de entrenamiento para obtener más información.

Entrenamiento distribuido

Puedes configurar un trabajo de entrenamiento sin servidores, un trabajo de ajuste de hiperparámetros o una canalización de entrenamiento para el entrenamiento distribuido si especificas varios grupos de trabajadores:

Usa tu primer grupo de trabajadores para configurar la réplica principal y establece el recuento de réplicas en 1.
Agrega más grupos de trabajadores para configurar réplicas de trabajadores, réplicas del servidor de parámetros o réplicas de evaluadores si tu framework de aprendizaje automático admite estas tareas adicionales del clúster para el entrenamiento distribuido.

Obtén más información sobre cómo usar el entrenamiento distribuido.

¿Qué sigue?

Obtén información para crear un recurso persistente y ejecutar trabajos de entrenamiento sin servidor.
Consulta Crea trabajos de entrenamiento sin servidores para obtener información sobre cómo crear trabajos de entrenamiento sin servidores para ejecutar tus aplicaciones de entrenamiento sin servidores en Gemini Enterprise Agent Platform.
Consulta Crea canalizaciones de entrenamiento para obtener información sobre cómo crear canalizaciones de entrenamiento para ejecutar aplicaciones de entrenamiento sin servidores en Gemini Enterprise Agent Platform.
Consulta Usa el ajuste de hiperparámetros para obtener información sobre las búsquedas del ajuste de hiperparámetros.