Elige un método de entrenamiento sin servidores de Gemini Enterprise Agent Platform

Si escribes tu propio código de entrenamiento en lugar de usar AutoML, existen varias formas de realizar un entrenamiento sin servidores de la plataforma de agentes de Gemini Enterprise que debes tener en cuenta. En este documento, se proporciona una breve descripción general y una comparación de las diferentes formas en las que puedes ejecutar el entrenamiento sin servidores.

Recursos de entrenamiento sin servidores en Agent Platform

Existen tres tipos de recursos de Agent Platform que puedes crear para entrenar modelos personalizados en Agent Platform:

Cuando creas un trabajo personalizado, debes especificar la configuración que Agent Platform necesita para ejecutar tu código de entrenamiento, incluido lo siguiente:

En los grupos de trabajadores, puedes especificar la siguiente configuración:

Los trabajos de ajuste de hiperparámetros tienen parámetros de configuración adicionales, como la métrica. Obtén más información sobre el ajuste de hiperparámetros.

Una canalización de entrenamiento organiza trabajos de entrenamiento sin servidor o trabajos de ajuste de hiperparámetros con pasos adicionales, como cargar un conjunto de datos o subir el modelo a Agent Platform después de que el trabajo de entrenamiento se completa de forma correcta.

Recursos de entrenamiento sin servidores

Para ver las canalizaciones de entrenamiento existentes en tu proyecto, ve a la página Canalizaciones de entrenamiento en la sección Agent Platform de la consola deGoogle Cloud .

Ve a Canalizaciones de entrenamiento

Para ver los trabajos personalizados existentes en tu proyecto, ve a la página Trabajos personalizados.

Ir a Trabajos personalizados

Para ver los trabajos de ajuste de hiperparámetros existentes en tu proyecto, ve a la página Ajuste de hiperparámetros.

Ir a Ajuste de hiperparámetros

Contenedores compilados previamente y personalizados

Antes de enviar un trabajo de entrenamiento sin servidores, un trabajo de ajuste de hiperparámetros o una canalización de entrenamiento a Agent Platform, debes crear una aplicación de entrenamiento de Python o un contenedor personalizado para definir el código de entrenamiento y las dependencias que deseas ejecutar en Agent Platform. Si creas una aplicación de entrenamiento de Python mediante TensorFlow, scikit-learn o XGBoost, puedes usar nuestros contenedores compilados con anterioridad para ejecutar tu código. Si no estás seguro de cuál de estas opciones elegir, consulta los requisitos de código de entrenamiento para obtener más información.

Entrenamiento distribuido

Puedes configurar un trabajo de entrenamiento sin servidores, un trabajo de ajuste de hiperparámetros o una canalización de entrenamiento para el entrenamiento distribuido si especificas varios grupos de trabajadores:

  • Usa tu primer grupo de trabajadores para configurar la réplica principal y establece el recuento de réplicas en 1.
  • Agrega más grupos de trabajadores para configurar réplicas de trabajadores, réplicas del servidor de parámetros o réplicas de evaluadores si tu framework de aprendizaje automático admite estas tareas adicionales del clúster para el entrenamiento distribuido.

Obtén más información sobre cómo usar el entrenamiento distribuido.

¿Qué sigue?