Ce document explique les principales différences entre les méthodes d'entraînement disponibles sur Google Cloud. Votre choix dépend de l'expertise de votre équipe, du niveau de contrôle dont vous avez besoin et de vos préférences en matière d'infrastructure.
Avec AutoML, vous créez et entraînez un modèle avec un minimum d'efforts techniques. Vous pouvez utiliser AutoML pour créer rapidement des prototypes de modèles et explorer de nouveaux ensembles de données avant d'investir dans le développement. Par exemple, vous pouvez l'utiliser pour connaître les fonctionnalités les plus adaptées à un ensemble de données spécifique.
Avec l'entraînement personnalisé, vous pouvez créer une application d'entraînement optimisée pour votre résultat ciblé. Vous contrôlez les fonctionnalités de l'application d'entraînement, des tâches à nœud unique à l'entraînement distribué massif à plusieurs nœuds. En d'autres termes, vous pouvez cibler n'importe quel objectif, utiliser n'importe quel algorithme, développer vos propres fonctions ou métriques de perte, ou effectuer toute autre personnalisation.
Entraînement sans serveur Gemini Enterprise Agent Platform : il s'agit d'une approche sans serveur dans laquelle vous envoyez votre tâche d'entraînement et Google Cloud provisionne, gère et libère les ressources de calcul pour vous. Elle est idéale pour les expérimentations et les tâches pour lesquelles vous n'avez pas besoin d'une capacité garantie.
Les clusters d'entraînement Gemini Enterprise Agent Platform sont une fonctionnalité d'entraînement personnalisé conçue pour les tâches d'entraînement à grande échelle et hautes performances. Ils vous permettent de réserver un cluster dédié de ressources de calcul puissantes (telles que des GPU A100 ou H100) pour votre usage exclusif, ce qui garantit la capacité et les performances pour les tâches d'entraînement critiques et de longue durée.
Avec Ray sur Vertex AI, vous pouvez utiliser le framework de calcul distribué de Ray sur Google Cloud l'infrastructure. Ray sur Vertex AI fournit un environnement géré avec des ressources de calcul configurables, une intégration avec des services tels que Vertex AI Inference et BigQuery, ainsi que des options de mise en réseau flexibles pour développer et exécuter des charges de travail distribuées.
Avec BigQuery, vous pouvez entraîner des modèles à l'aide de vos données BigQuery directement dans BigQuery. Les commandes SQL vous permettent de créer rapidement un modèle et de l'utiliser pour obtenir des inférences par lot.
Pour comparer les différentes fonctionnalités ainsi que le niveau d'expertise pour chaque service, consultez le tableau suivant.
| AutoML | Entraînement sans serveur | Clusters d'entraînement | Ray sur BigQuery | BigQuery ML | |
|---|---|---|---|---|---|
| Connaissance de la data science requise | Non | Oui, pour développer l'application d'entraînement et gérer la préparation des données. | Oui, pour développer l'application d'entraînement et gérer la préparation des données. | Une compréhension de base des concepts de ML et des workflows de données est utile. | Non |
| Capacité de programmation nécessaire | Non, AutoML s'utilise sans code. | Oui, pour développer l'application d'entraînement. | Oui, pour développer l'application d'entraînement. | Oui. | Oui. |
| Temps d'entraînement du modèle | Durée plus courte. La préparation des données est réduite. Aucun développement n'est nécessaire. | Durée plus longue. Implique le développement de code et le temps de provisionnement des ressources à la demande pour chaque tâche. | Durée plus longue. Implique le développement de code, mais le démarrage des tâches est plus rapide, car les ressources sont déjà réservées, ce qui élimine les files d'attente et le temps de provisionnement. | Le temps d'entraînement dépend de la logique du code (préparation et entraînement des données) et du temps de provisionnement des ressources. | Durée plus courte. Le développement de modèles est rapide, car BigQuery ML exploite le moteur de calcul BigQuery pour l'entraînement, l'évaluation et l'inférence. |
| Limites sur les objectifs de machine learning | Oui. Vous devez cibler l'un des objectifs prédéfinis d'AutoML. | Non | Non | Non | Oui |
| Optimiser manuellement les performances du modèle avec les réglages d'hyperparamètres | Non. AutoML effectue certains réglages automatiques, mais vous ne pouvez pas modifier les valeurs. | Oui. Vous pouvez ajuster le modèle lors de chaque entraînement pour expérimenter et comparer. | Oui. Vous pouvez ajuster le modèle lors de chaque entraînement pour expérimenter et comparer. | Oui. Vous fournissez le code d'entraînement personnalisé, ce qui vous donne un contrôle total sur les valeurs des hyperparamètres. | Oui. BigQuery ML permet de régler les hyperparamètres lors de l'entraînement des modèles. |
| Contrôler les aspects de l'environnement d'entraînement | Limitée. Vous pouvez spécifier le budget pour les heures d'entraînement et activer l'arrêt prématuré. | Oui. Vous spécifiez le type de machine Compute Engine, la taille du disque et l'image de conteneur pour chaque tâche. | Oui. Vous disposez d'un contrôle maximal, en réservant des types de machines hautes performances spécifiques (par exemple, des H100), des configurations de disque et des paramètres réseau pour votre usage exclusif, ce qui garantit la capacité. | Oui. Vous disposez d'un contrôle important, y compris des images Docker personnalisées, des types de machines pour les nœuds principaux et de calcul, ainsi que le nombre et le type d'accélérateurs (GPU). | Non |
| Limites de taille des données | Oui. Les limites de taille des données varient selon le type d'ensemble de données. | Non | Non | Non. Toutefois, la taille maximale de la réponse à une requête est de 10 Go pour les lectures BigQuery. | Oui. BigQuery ML applique des quotas appropriés par projet. Pour en savoir plus, consultez la page Quotas et limites. |
Étapes suivantes
- Choisissez un tutoriel d'introduction pour commencer à utiliser l'entraînement de l'IA Vertex.
- En savoir plus sur l'entraînement d'un modèle AutoML.
- Découvrez l'entraînement sans serveur Gemini Enterprise Agent Platform.
- Découvrez les clusters d'entraînement Gemini Enterprise Agent Platform.
- En savoir plus sur Ray sur BigQuery.