Entraîner et utiliser vos propres modèles

Cette page présente le workflow d'entraînement et d'utilisation de vos propres modèles de machine learning (ML) sur Vertex AI. Vertex AI propose un large éventail de méthodes d'entraînement conçues pour répondre à vos besoins, de l'entraînement entièrement automatisé à l'entraînement entièrement personnalisé.

  • AutoML : créez des modèles de haute qualité avec un minimum d'efforts techniques en exploitant les fonctionnalités de ML automatisé de Google.
  • Entraînement sans serveur Vertex AI : exécutez votre code d'entraînement personnalisé dans un environnement à la demande entièrement géré, sans vous soucier de l'infrastructure.
  • Clusters d'entraînement Vertex AI : exécutez des tâches d'entraînement à grande échelle et hautes performances sur un cluster d'accélérateurs dédié et réservé à votre usage exclusif.
  • Ray sur Vertex AI : mettez à l'échelle les applications Python et les charges de travail de ML à l'aide du framework Ray Open Source sur un service géré.

Pour obtenir de l'aide dans votre choix de ces méthodes, consultez la page Choisir une méthode d'entraînement.

AutoML

AutoML sur Vertex AI vous permet de créer un modèle de ML sans code à partir des données d'entraînement que vous fournissez. AutoML peut automatiser des tâches telles que la préparation des données, la sélection de modèles, le réglage des hyperparamètres et le déploiement pour différents types de données et tâches de prédiction. Cela peut rendre le ML plus accessible à un large éventail d'utilisateurs.

Types de modèles que vous pouvez créer à l'aide d'AutoML

Les types de modèles que vous pouvez créer dépendent du type de données dont vous disposez. Vertex AI propose des solutions AutoML pour les types de données et les objectifs de modèle suivants :

Type de données Objectifs possibles
Données d'image Classification et détection d'objets
Données tabulaires Classification/Régression et prévision

Pour en savoir plus sur AutoML, consultez Présentation de l'entraînement AutoML.

Exécuter du code d'entraînement personnalisé sur Vertex AI

Si AutoML ne répond pas à vos besoins, vous pouvez fournir votre propre code d'entraînement et l'exécuter sur l'infrastructure gérée de Vertex AI. Vous bénéficiez ainsi d'un contrôle et d'une flexibilité totaux sur l'architecture et la logique d'entraînement de votre modèle, ce qui vous permet d'utiliser le framework de ML de votre choix.

Vertex AI propose deux modes principaux pour exécuter votre code d'entraînement personnalisé : un environnement sans serveur à la demande ou un cluster dédié et réservé.

Vertex AI Training sans serveur

L'entraînement sans serveur est un service entièrement géré qui vous permet d'exécuter votre application d'entraînement personnalisée sans avoir à provisionner ni à gérer d'infrastructure. Vous regroupez votre code dans un conteneur, définissez les spécifications de votre machine (y compris les processeurs et les GPU), puis l'envoyez en tant que CustomJob.

Vertex AI s'occupe du reste :

  • Provisionnement des ressources de calcul pour la durée de votre job.
  • Exécuter votre code d'entraînement.
  • Supprimer les ressources une fois le job terminé.

Ce modèle à la demande et au paiement à l'utilisation est idéal pour les tests, le prototypage rapide et les tâches de production qui ne nécessitent pas de capacité instantanée et garantie.

Pour en savoir plus, consultez Créer un job personnalisé d'entraînement sans serveur.

Clusters d'entraînement Vertex AI

Pour l'entraînement à grande échelle, hautes performances et critique, vous pouvez réserver un cluster d'accélérateurs dédié. Cela garantit la capacité et élimine les files d'attente, ce qui permet à vos jobs de démarrer immédiatement.

Bien que vous utilisiez ces ressources de manière exclusive, Vertex AI gère toujours les frais opérationnels liés à la gestion du cluster, y compris la maintenance du matériel et l'application de correctifs à l'OS. Cette approche "serverful gérée" vous offre la puissance d'un cluster dédié sans la complexité de la gestion.

Ray sur Vertex AI

Ray sur Vertex AI est un service qui vous permet d'utiliser le framework Ray Open Source pour mettre à l'échelle des applications d'IA et Python directement dans la plate-forme Vertex AI. Ray est conçu pour fournir l'infrastructure nécessaire au calcul distribué et au traitement en parallèle pour votre workflow de ML.

Ray sur Vertex AI fournit un environnement géré pour exécuter des applications distribuées à l'aide du framework Ray, offrant une évolutivité et une intégration avec les services Google Cloud .

Pour en savoir plus sur Ray sur Vertex AI, consultez la présentation de Ray sur Vertex AI.