En este documento se explican las principales diferencias entre los métodos de entrenamiento disponibles en Google Cloud. Tu elección dependerá de la experiencia de tu equipo, del nivel de control que necesites y de tus preferencias de infraestructura.
Con AutoML, puedes crear y entrenar un modelo con un esfuerzo técnico mínimo. Puedes usar AutoML para crear prototipos de modelos rápidamente y explorar nuevos conjuntos de datos antes de invertir en el desarrollo. Por ejemplo, puedes usarlo para saber qué funciones son las más adecuadas para un conjunto de datos concreto.
Con el entrenamiento personalizado, puedes crear una aplicación de entrenamiento optimizada para el resultado que quieras conseguir. Tienes control total sobre la funcionalidad de la aplicación de entrenamiento, desde trabajos de un solo nodo hasta entrenamientos distribuidos masivos de varios nodos. Es decir, puede orientar sus campañas a cualquier objetivo, usar cualquier algoritmo, desarrollar sus propias funciones de pérdida o métricas, o hacer cualquier otra personalización.
Entrenamiento sin servidor de Vertex AI: se trata de un enfoque sin servidor en el que envías tu tarea de entrenamiento y Google Cloud provisiona, gestiona y libera los recursos de computación por ti. Es ideal para experimentar y para trabajos en los que no necesitas capacidad asegurada.
Los clústeres de entrenamiento de Vertex AI son una función del entrenamiento personalizado diseñada para tareas de entrenamiento de alto rendimiento a gran escala. Te permite reservar un clúster dedicado de potentes recursos de computación (como GPUs A100 u H100) para tu uso exclusivo, lo que garantiza la capacidad y el rendimiento de las tareas de entrenamiento críticas y de larga duración.
Con Ray en Vertex AI, puedes usar el framework de computación distribuida de Ray en la infraestructura de Google Cloud . Ray en Vertex AI proporciona un entorno gestionado con recursos de computación configurables, integración con servicios como Vertex AI Inference y BigQuery, y opciones de redes flexibles para desarrollar y ejecutar cargas de trabajo distribuidas.
Con BigQuery, puedes entrenar modelos con tus datos de BigQuery directamente en BigQuery. Con los comandos SQL, puedes crear rápidamente un modelo y usarlo para obtener inferencias por lotes.
Para comparar las diferentes funciones y la experiencia necesaria para cada servicio, consulta la siguiente tabla.
| AutoML | Formación sin servidor | Entrenar clústeres | Ray en Vertex AI | BigQuery ML | |
|---|---|---|---|---|---|
| Se necesitan conocimientos de ciencia de datos | No | Sí, para desarrollar la aplicación de entrenamiento y gestionar la preparación de los datos. | Sí, para desarrollar la aplicación de entrenamiento y gestionar la preparación de los datos. | Es recomendable tener conocimientos básicos sobre los conceptos de aprendizaje automático y los flujos de trabajo de datos. | No |
| Se necesitan conocimientos de programación | No. AutoML no requiere código. | Sí, para desarrollar la aplicación de entrenamiento. | Sí, para desarrollar la aplicación de entrenamiento. | Sí. | Sí. |
| Tiempo de entrenamiento del modelo | Inferior. No es necesario preparar tantos datos y no se requiere desarrollo. | Más alto. Implica el desarrollo de código y el tiempo de aprovisionamiento de recursos bajo demanda para cada trabajo. | Más alto. Implica el desarrollo de código, pero el inicio del trabajo es más rápido, ya que los recursos ya están reservados, lo que elimina las colas y el tiempo de aprovisionamiento. | El tiempo de entrenamiento depende de la lógica del código (preparación de datos y entrenamiento) y del tiempo necesario para aprovisionar los recursos. | Inferior. El desarrollo de modelos es rápido, ya que BigQuery ML aprovecha el motor computacional de BigQuery para el entrenamiento, la evaluación y la inferencia. |
| Límites de los objetivos de aprendizaje automático | Sí. Debes seleccionar uno de los objetivos predefinidos de AutoML. | No | No | No | Sí |
| Puede optimizar manualmente el rendimiento de los modelos con el ajuste de hiperparámetros | No. AutoML realiza algunos ajustes automáticos, pero no puedes modificar los valores. | Sí. Puedes ajustar el modelo durante cada entrenamiento para experimentar y comparar. | Sí. Puedes ajustar el modelo durante cada entrenamiento para experimentar y comparar. | Sí. Tú proporcionas el código de entrenamiento personalizado, lo que te da un control total sobre los valores de los hiperparámetros. | Sí. BigQuery ML admite el ajuste de hiperparámetros al entrenar modelos. |
| Puede controlar aspectos del entorno de formación | limitado. Puedes especificar el presupuesto de las horas de entrenamiento y habilitar la detección anticipada. | Sí. Especifica el tipo de máquina de Compute Engine, el tamaño del disco y la imagen del contenedor de cada trabajo. | Sí. Tienes el máximo control, ya que puedes reservar tipos de máquinas de alto rendimiento específicos (por ejemplo, H100), configuraciones de disco y ajustes de red para tu uso exclusivo, lo que garantiza la capacidad. | Sí. Tienes un control significativo, como imágenes de Docker personalizadas, tipos de máquinas para nodos principales y de trabajador, y el número y el tipo de aceleradores (GPUs). | No |
| Límites en el tamaño de los datos | Sí. Las limitaciones de tamaño de los datos varían en función del tipo de conjunto de datos. | No | No | No. Sin embargo, el tamaño máximo de respuesta de las consultas de lectura de BigQuery es de 10 GB. | Sí. BigQuery ML aplica las cuotas pertinentes a cada proyecto. Para obtener más información, consulta Cuotas y límites. |
Siguientes pasos
- Elige un tutorial introductorio para empezar a usar Vertex AI Training.
- Consulta más información sobre cómo entrenar un modelo de AutoML.
- Consulta información sobre el entrenamiento sin servidor de Vertex AI.
- Consulta información sobre los clústeres de entrenamiento de Vertex AI.
- Consulta más información sobre Ray en Vertex AI.