En este documento, se explican las diferencias clave entre los métodos de entrenamiento disponibles en Google Cloud. Tu elección depende de la experiencia de tu equipo, el nivel de control que necesitas y tu preferencia de infraestructura.
Con AutoML, puedes crear y entrenar un modelo con un esfuerzo técnico mínimo. Puedes usar AutoML para prototipar modelos con rapidez y explorar conjuntos de datos nuevos antes de invertir en el desarrollo. Por ejemplo, puedes usarlo para saber qué atributos son mejores en un conjunto de datos determinado.
Con el entrenamiento personalizado, puedes crear una aplicación de entrenamiento optimizada para tu resultado objetivo. Tienes el control completo sobre la funcionalidad de la aplicación de entrenamiento, desde trabajos de un solo nodo hasta entrenamientos distribuidos masivos de varios nodos. Es decir, puedes fijar cualquier objetivo, usar cualquier algoritmo, desarrollar tus propias funciones o métricas de pérdida, o hacer cualquier otra personalización.
Entrenamiento sin servidores de Vertex AI: Es un enfoque sin servidores en el que envías tu trabajo de entrenamiento y Google Cloud aprovisiona, administra y libera los recursos de procesamiento por ti. Es ideal para la experimentación y para los trabajos en los que no necesitas capacidad garantizada.
Los clústeres de entrenamiento de Vertex AI son una función del entrenamiento personalizado diseñada para trabajos de entrenamiento de alto rendimiento y a gran escala. Te permite reservar un clúster exclusivo de recursos de procesamiento potentes (como las GPU A100 o H100) para tu uso exclusivo, lo que garantiza la capacidad y el rendimiento para las tareas de entrenamiento críticas y de larga duración.
Con Ray en Vertex AI, puedes usar el framework de procesamiento distribuido de Ray en la infraestructura de Google Cloud . Ray en Vertex AI proporciona un entorno administrado con recursos de procesamiento configurables, integración con servicios como Vertex AI Inference y BigQuery, y opciones de redes flexibles para desarrollar y ejecutar cargas de trabajo distribuidas.
Con BigQuery, puedes entrenar modelos con tus datos de BigQuery directamente en BigQuery. Con los comandos de SQL, puedes crear rápidamente un modelo y usarlo para obtener inferencias por lotes.
Para comparar la funcionalidad y experiencia diferentes que se requieren para cada servicio, revisa la siguiente tabla.
| AutoML | Entrenamiento sin servidores | Cómo entrenar clústeres | Ray on Vertex AI | BigQuery ML | |
|---|---|---|---|---|---|
| Experiencia necesaria en ciencia de datos | No | Sí, para desarrollar la aplicación de entrenamiento y controlar la preparación de datos. | Sí, para desarrollar la aplicación de entrenamiento y controlar la preparación de datos. | Es beneficioso tener conocimientos básicos sobre los conceptos de AA y los flujos de trabajo de datos. | No |
| Habilidad de programación necesaria | No, AutoML no requiere código. | Sí, para desarrollar la aplicación de entrenamiento. | Sí, para desarrollar la aplicación de entrenamiento. | Sí. | Sí. |
| Tiempo para entrenar el modelo | Menor. Se requiere menos preparación de los datos, y no se necesita desarrollo. | Mayor. Implica el desarrollo de código y el tiempo de aprovisionamiento de recursos a pedido para cada trabajo. | Mayor. Implica el desarrollo de código, pero el inicio del trabajo es más rápido, ya que los recursos ya están reservados, lo que elimina las colas y el tiempo de aprovisionamiento. | El tiempo de entrenamiento depende de la lógica del código (preparación y entrenamiento de datos) y del tiempo de aprovisionamiento de recursos. | Menor. El desarrollo de modelos es rápido, ya que BigQuery ML aprovecha el motor de procesamiento de BigQuery para el entrenamiento, la evaluación y la inferencia. |
| Límites de los objetivos de aprendizaje automático | Sí. Debes fijarte uno de los objetivos predefinidos de AutoML. | No | No | No | Sí |
| Se puede optimizar el rendimiento de los modelos de forma manual con el ajuste de hiperparámetros | No. AutoML realiza algunos ajustes automatizados, pero no puedes modificar los valores. | Sí. Es posible ajustar el modelo durante cada ejecución del entrenamiento para experimentar y comparar. | Sí. Es posible ajustar el modelo durante cada ejecución del entrenamiento para experimentar y comparar. | Sí. Proporcionas el código de entrenamiento personalizado, lo que te brinda control total sobre los valores de los hiperparámetros. | Sí. BigQuery ML admite el ajuste de hiperparámetros durante el entrenamiento de modelos. |
| Se pueden controlar aspectos del entorno de entrenamiento | Limitado. Puedes especificar el presupuesto para las horas de entrenamiento y habilitar la detención anticipada. | Sí. Para cada trabajo, debes especificar el tipo de máquina de Compute Engine, el tamaño del disco y la imagen del contenedor. | Sí. Tienes el máximo control, ya que puedes reservar tipos de máquinas específicos de alto rendimiento (p.ej., H100), configuraciones de disco y parámetros de configuración de red para tu uso exclusivo, lo que garantiza la capacidad. | Sí. Tienes un control significativo, incluidas imágenes de Docker personalizadas, tipos de máquinas para nodos principales y de trabajadores, y la cantidad y el tipo de aceleradores (GPUs). | No |
| Límites de tamaño de los datos | Sí. Las limitaciones de tamaño de los datos varían según el tipo de conjunto de datos. | No | No | No. Sin embargo, el tamaño máximo de respuesta a una consulta es de 10 GB para las lecturas de BigQuery. | Sí. BigQuery ML aplica las cuotas adecuadas para cada proyecto. Para obtener más información, consulta Cuotas y límites. |
¿Qué sigue?
- Elige un instructivo introductorio para comenzar con Vertex AI Training.
- Obtén más información sobre el entrenamiento de un modelo de AutoML.
- Obtén más información sobre el entrenamiento sin servidores de Vertex AI.
- Obtén más información sobre los clústeres de entrenamiento de Vertex AI.
- Obtén más información sobre Ray en Vertex AI.