En este documento, se explican las diferencias clave entre los métodos de entrenamiento disponibles en Google Cloud. Tu elección depende de la experiencia de tu equipo, el nivel de control que necesitas y tu preferencia de infraestructura.
Con AutoML, puedes crear y entrenar un modelo con un esfuerzo técnico mínimo. Puedes usar AutoML para prototipar modelos con rapidez y explorar conjuntos de datos nuevos antes de invertir en el desarrollo. Por ejemplo, puedes usarlo para saber qué atributos son mejores en un conjunto de datos determinado.
Con el entrenamiento personalizado, puedes crear una aplicación de entrenamiento optimizada para tu resultado objetivo. Tienes el control sobre la funcionalidad de la aplicación de entrenamiento, desde trabajos de un solo nodo hasta entrenamiento distribuido masivo de varios nodos. Es decir, puedes fijar cualquier objetivo, usar cualquier algoritmo, desarrollar tus propias funciones o métricas de pérdida, o hacer cualquier otra personalización.
Entrenamiento sin servidores de Colab Enterprise: Es un enfoque sin servidores en el que envías tu trabajo de entrenamiento y Google Cloud aprovisiona, administra y libera los recursos de procesamiento por ti. Es ideal para la experimentación y para trabajos en los que no necesitas capacidad garantizada.
Los clústeres de entrenamiento de Colab Enterprise son una función dentro del entrenamiento personalizado diseñada para trabajos de entrenamiento de alto rendimiento y a gran escala. Te permite reservar un clúster dedicado de recursos de procesamiento potentes (como GPUs A100 o H100) para tu uso exclusivo, lo que garantiza la capacidad y el rendimiento para tareas de entrenamiento de larga duración y fundamentales.
Con Ray en Vertex AI, puedes usar el framework de procesamiento distribuido de Ray en la infraestructura. Google Cloud Ray en Vertex AI proporciona un entorno administrado con recursos de procesamiento configurables, integración con servicios como Vertex AI Inference y BigQuery, y opciones de redes flexibles para desarrollar y ejecutar cargas de trabajo distribuidas.
Con BigQuery, puedes entrenar modelos con tus datos de BigQuery directamente en BigQuery. Mediante los comandos de SQL, puedes crear con rapidez un modelo y usarlo para obtener inferencias por lotes.
Para comparar la funcionalidad y experiencia diferentes que se requieren para cada servicio, revisa la siguiente tabla.
| AutoML | Entrenamiento sin servidores | Clústeres de entrenamiento | Ray en BigQuery | BigQuery ML | |
|---|---|---|---|---|---|
| Experiencia necesaria en ciencia de datos | No | Sí, para desarrollar la aplicación de entrenamiento y controlar la preparación de los datos. | Sí, para desarrollar la aplicación de entrenamiento y controlar la preparación de los datos. | Es beneficioso tener una comprensión básica de los conceptos de AA y los flujos de trabajo de datos. | No |
| Habilidad de programación necesaria | No, AutoML no tiene código. | Sí, para desarrollar la aplicación de entrenamiento. | Sí, para desarrollar la aplicación de entrenamiento. | Sí. | Sí. |
| Tiempo para entrenar el modelo | Menor. Se requiere menos preparación de los datos, y no se necesita desarrollo. | Mayor. Implica el desarrollo de código y el tiempo de aprovisionamiento de recursos a pedido para cada trabajo. | Mayor. Implica el desarrollo de código, pero el inicio del trabajo es más rápido, ya que los recursos ya están reservados, lo que elimina las colas y el tiempo de aprovisionamiento. | El tiempo de entrenamiento depende de la lógica del código (preparación y entrenamiento de datos) y del tiempo para aprovisionar recursos. | Menor. El desarrollo de modelos es rápido, ya que BigQuery ML aprovecha el motor de procesamiento de BigQuery para el entrenamiento, la evaluación y la inferencia. |
| Límites de los objetivos de aprendizaje automático | Sí. Debes fijarte uno de los objetivos predefinidos de AutoML. | No | No | No | Sí |
| Se puede optimizar el rendimiento de los modelos de forma manual con el ajuste de hiperparámetros | No. AutoML realiza un ajuste automatizado, pero no puedes modificar los valores. | Sí. Es posible ajustar el modelo durante cada ronda de entrenamiento para experimentar y comparar. | Sí. Es posible ajustar el modelo durante cada ronda de entrenamiento para experimentar y comparar. | Sí. Proporcionas el código de entrenamiento personalizado, lo que te brinda control total sobre los valores de los hiperparámetros. | Sí. BigQuery ML admite el ajuste de hiperparámetros cuando se entrenan modelos. |
| Se pueden controlar aspectos del entorno de entrenamiento | Limitado. Puedes especificar el presupuesto para las horas de entrenamiento y habilitar la interrupción anticipada. | Sí. Especificas el tipo de máquina de Compute Engine, el tamaño del disco y la imagen del contenedor para cada trabajo. | Sí. Tienes el máximo control, ya que reservas tipos de máquinas específicos de alto rendimiento (p.ej., H100), configuraciones de disco y parámetros de configuración de red para tu uso exclusivo, lo que garantiza la capacidad. | Sí. Tienes un control significativo, incluidas las imágenes de Docker personalizadas, los tipos de máquinas para los nodos principales y de trabajador, y la cantidad y el tipo de aceleradores (GPUs). | No |
| Límites de tamaño de los datos | Sí. Las limitaciones de tamaño de los datos varían según el tipo de conjunto de datos. | No | No | No. Sin embargo, hay un tamaño máximo de respuesta a una consulta de 10 GB para las lecturas de BigQuery. | Sí. BigQuery ML aplica las cuotas adecuadas para cada proyecto. Para obtener más información, consulta Cuotas y límites. |
¿Qué sigue?
- Elige un instructivo introductorio para comenzar con Vertex AI Training.
- Obtén más información sobre el entrenamiento de un modelo de AutoML.
- Obtén información sobre el entrenamiento sin servidores de Colab Enterprise.
- Obtén información sobre los clústeres de entrenamiento de Colab Enterprise.
- Obtén más información sobre Ray en BigQuery.