Ce document explique comment créer et exécuter un job qui utilise un processeur graphique (GPU). Pour en savoir plus sur les fonctionnalités et les restrictions concernant les GPU, consultez À propos des GPU dans la documentation Compute Engine.
Lorsque vous créez un job Batch, vous pouvez éventuellement utiliser des GPU pour accélérer des charges de travail spécifiques. Les cas d'utilisation courants des jobs qui utilisent des GPU incluent le traitement intensif des données et les charges de travail d'intelligence artificielle (IA) telles que le machine learning (ML).
Avant de commencer
- Si vous n'avez jamais utilisé Batch, consultez Premiers pas avec Batch et activez Batch en remplissant les conditions préalables pour les projets et les utilisateurs.
-
Pour obtenir les autorisations nécessaires pour créer un job, demandez à votre administrateur de vous accorder les rôles IAM suivants :
-
Éditeur de tâches par lot (
roles/batch.jobsEditor) sur le projet -
Utilisateur du compte de service (
roles/iam.serviceAccountUser) sur le compte de service du job, qui par défaut est le compte de service Compute Engine par défaut
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.
-
Éditeur de tâches par lot (
Créer un job qui utilise des GPU
Pour créer un job qui utilise des GPU, procédez comme suit :
- Planifiez les exigences d'une tâche qui utilise des GPU.
- Créez un job avec les exigences et les méthodes que vous avez identifiées. Pour obtenir des exemples de création d'un job à l'aide des options recommandées, consultez Créer un exemple de job utilisant des GPU dans ce document.
Planifier les exigences d'un job qui utilise des GPU
Avant de créer un job qui utilise des GPU, planifiez les exigences du job comme expliqué dans les sections suivantes :
- Sélectionner le type de machine GPU et l'option de consommation
- Installez les pilotes de GPU.
- Définir les ressources de VM compatibles
Étape 1 : Sélectionnez le type de machine GPU et l'option de consommation
Les exigences d'un job varient en fonction du type de machine GPU et de l'option de consommation que vous préférez. Les options de chaque élément peuvent être interdépendantes.
Pour sélectionner le type de machine GPU et l'option de consommation pour votre job, procédez comme suit :
Identifiez et sélectionnez votre priorité :
- Si vous souhaitez privilégier les performances et le prix de base, consultez la section Sélectionner le type de machine GPU de ce document.
- Si vous souhaitez donner la priorité à la disponibilité des ressources ou aux remises, consultez la section Sélectionner l'option de consommation de ce document.
Effectuez la sélection restante en fonction de ce qui est compatible avec votre première sélection.
Pour identifier les options compatibles avec votre première sélection, consultez Disponibilité des options de consommation par type de machine dans la documentation Compute Engine.
Consultez la section restante pour Sélectionner l'option de consommation ou Sélectionner le type de machine GPU, respectivement.
Sélectionnez le type de machine GPU.
Pour sélectionner le type de machine GPU pour un job et comprendre ses exigences, procédez comme suit :
Sélectionnez un type de machine GPU : pour consulter les types de machines GPU disponibles (les combinaisons valides de type de GPU, de nombre de GPU et de type de machine (vCPU et mémoire)) et leurs cas d'utilisation recommandés, consultez Types de machines GPU et Famille de machines optimisées pour les accélérateurs dans la documentation Compute Engine.
Comprendre les exigences des tâches pour votre type de machine GPU : Les champs requis pour qu'une tâche spécifie un type de machine GPU varient en fonction des catégories du tableau suivant :
Types de machines avec GPU et exigences des tâches GPU pour les VM optimisées pour les accélérateurs : les VM dont le type de machine appartient à la famille de machines optimisées pour les accélérateurs sont automatiquement associées à un type et un nombre spécifiques de ces GPU.
Pour utiliser des GPU pour les VM optimisées pour les accélérateurs, nous vous recommandons de spécifier le type de machine. Chaque type de machine optimisé pour les accélérateurs n'est compatible qu'avec un type et un nombre spécifiques de GPU. Il est donc fonctionnellement équivalent de spécifier ou non ces valeurs en plus du type de machine optimisé pour les accélérateurs.
Plus précisément, Batch permet également de spécifier uniquement le type et le nombre de GPU pour les VM optimisées pour les accélérateurs, mais les options de processeur virtuel et de mémoire qui en résultent sont souvent très limitées. Par conséquent, nous vous recommandons de vérifier que les options de processeur virtuel et de mémoire disponibles sont compatibles avec les exigences de tâches du job.
GPU pour les VM N1 : pour ces GPU, vous devez spécifier le type et la quantité à associer à chaque VM. Ils doivent être associés à des VM dont le type de machine appartient à la série de machines N1.
Pour utiliser des GPU pour les VM N1, nous vous recommandons de spécifier au moins le type et le nombre de GPU. Assurez-vous que la combinaison de valeurs correspond à l'une des options de GPU valides pour les types de machines N1. Les options de processeur virtuel et de mémoire pour les VM N1 qui utilisent un type et un nombre de GPU spécifiques sont assez flexibles. Sauf si vous créez le job à l'aide de la console Google Cloud , vous pouvez laisser Batch sélectionner automatiquement un type de machine qui répond aux exigences des tâches du job.
Sélectionnez l'option de consommation.
Cette section explique comment sélectionner l'option de consommation pour un job et les exigences de job pour chaque option.
Le tableau suivant présente les options de consommation disponibles pour Batch et leurs exigences. Il les liste en fonction de leurs cas d'utilisation, de la disponibilité des ressources la plus élevée à la plus faible.
En résumé, nous recommandons à la plupart des utilisateurs de sélectionner l'option de consommation pour un job comme suit :
- Sauf si l'une des autres conditions est remplie, utilisez des VM à démarrage flexible (Preview) (méthode recommandée si elle répond à vos exigences) ou à la demande.
- Si votre job nécessite une très grande assurance de disponibilité des ressources ou si vous avez des réservations inutilisées que vous ne pouvez pas supprimer, utilisez des réservations en mode calendrier (aperçu) (recommandées si elles répondent à vos besoins) ou des réservations.
- (Facultatif) Si votre charge de travail est très tolérante aux pannes, vous pouvez peut-être réduire les coûts en essayant d'utiliser des VM Spot.
| Options de consommation et exigences associées | |
|---|---|
Réservations
|
Batch utilise des réservations pour les tâches qui peuvent consommer des VM réservées inutilisées. Pour en savoir plus sur les exigences liées aux jobs pour utiliser les réservations, consultez la page Assurer la disponibilité des ressources à l'aide de réservations de VM. |
Réservations en mode Agenda (preview)
|
Batch utilise des réservations en mode Agenda pour les jobs qui remplissent toutes les conditions suivantes :
|
VM à démarrage flexible (preview)
|
Batch utilise des VM à démarrage flexible pour les tâches qui remplissent toutes les conditions suivantes :
|
À la demande
|
Batch utilise le mode à la demande pour la plupart des autres jobs par défaut. Si vous souhaitez vous assurer qu'un job utilise le mode à la demande, procédez comme suit :1
1Exception : Pour les jobs qui utilisent la série de machines A3, le comportement par défaut est unique. Nous vous recommandons de ne pas utiliser de VM à la demande et de ne pas laisser le champ |
Les VM Spot
|
Batch utilise des VM Spot pour les jobs qui remplissent toutes les conditions suivantes :
|
Étape 2 : Installez les pilotes de GPU
Pour utiliser des GPU pour un job, vous devez installer les pilotes de GPU. Pour installer les pilotes de GPU, sélectionnez l'une des méthodes suivantes :
Installer automatiquement les pilotes de GPU (recommandé si possible) : comme indiqué dans les exemples, pour permettre à Batch d'extraire les pilotes de GPU requis depuis un emplacement tiers et de les installer pour vous, définissez le champ
installGpuDriversdu job surtrue. Cette méthode est recommandée si votre tâche ne nécessite pas l'installation manuelle de pilotes.Si vous devez spécifier la version du pilote de GPU que Batch installe, vous pouvez également définir le champ
driverVersion.Installez manuellement les pilotes de GPU : cette méthode est requise si l'une des conditions suivantes est remplie :
- Un job utilise à la fois des exécutables de script et de conteneur, et n'a pas d'accès à Internet. Pour en savoir plus sur l'accès d'un job, consultez Présentation de la mise en réseau par lot.
- Une tâche utilise une image de VM personnalisée. Pour en savoir plus sur les images d'OS de VM et sur celles que vous pouvez utiliser, consultez Présentation de l'environnement d'OS de VM.
Pour installer manuellement les pilotes de GPU requis, la méthode suivante est recommandée :
Créez une image de VM personnalisée incluant les pilotes GPU.
Pour installer les pilotes de GPU, exécutez un script d'installation en fonction de l'OS que vous souhaitez utiliser :
Si votre job comporte des exécutables de conteneur et n'utilise pas Container-Optimized OS, vous devez également installer le NVIDIA Container Toolkit.
Lorsque vous créez et envoyez un job qui utilise des GPU, spécifiez l'image de VM personnalisée qui inclut les pilotes de GPU et définissez le champ
installGpuDriversdu job surfalse(valeur par défaut).
Étape 3 : Définir les ressources de VM compatibles
Pour en savoir plus sur les exigences et les options permettant de définir les ressources de VM pour un job, consultez Ressources de job.
En résumé, vous devez effectuer toutes les opérations suivantes lorsque vous définissez les ressources de VM pour une tâche qui utilise des GPU :
Assurez-vous que le type de machine GPU est disponible dans l'emplacement des VM de votre job.
Pour savoir où les types de machines avec GPU sont disponibles, consultez la section Disponibilité des accélérateurs dans la documentation Compute Engine.
Si vous spécifiez le type de machine du job, assurez-vous qu'il dispose de suffisamment de processeurs virtuels et de mémoire pour répondre aux exigences des tâches du job. Vous devez spécifier le type de machine du job chaque fois que vous créez un job à l'aide de la console Google Cloud . Il est recommandé de le faire chaque fois que vous créez un job qui utilise des GPU pour les VM optimisées pour les accélérateurs.
Assurez-vous de définir les ressources de VM pour un job à l'aide d'une méthode valide :
- Définissez les ressources de VM directement à l'aide du champ
instances[].policy(recommandé si possible). Cette méthode est illustrée dans les exemples. - Définissez les ressources de la VM à l'aide d'un modèle en utilisant le champ
instances[].instanceTemplate. Cette méthode est requise pour installer manuellement les pilotes de GPU via une image personnalisée. Pour en savoir plus, consultez Définir les ressources de job à l'aide d'un modèle d'instance de VM.
- Définissez les ressources de VM directement à l'aide du champ
Créer un exemple de job qui utilise des GPU
Les sections suivantes expliquent comment créer un exemple de job pour chaque option de consommation. Plus précisément, les exemples de jobs utilisent les options recommandées : tous installent automatiquement les pilotes de GPU et tous définissent directement les ressources de VM.
| Option d'utilisation | Exemple d'instructions pour un job |
|---|---|
| Réservations ou réservations en mode Agenda (preview) |
Garantir la disponibilité des ressources à l'aide de réservations de VM |
| VM à démarrage flexible (preview) | |
| VM à la demande ou VM Spot |
Sélectionnez l'une des options suivantes en fonction de votre type de machine GPU : |
Utiliser des GPU et des VM à démarrage flexible
Vous pouvez créer un job qui utilise des GPU pour les VM A3 via le planificateur de charges de travail dynamique à l'aide de gcloud CLI ou de l'API Batch.
gcloud
Créez un fichier JSON qui installe les pilotes de GPU, spécifie un type de machine GPU compatible avec les VM à démarrage flexible, bloque les réservations et s'exécute dans un emplacement compatible avec le type de machine GPU.
Par exemple, pour créer un job de script de base qui utilise des VM à démarrage flexible et des GPU pour les VM optimisées pour les accélérateurs, créez un fichier JSON avec le contenu suivant.
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}." } } ] }, "taskCount": 3, "parallelism": 1 } ], "allocationPolicy": { "instances": [ { "installGpuDrivers": INSTALL_GPU_DRIVERS, "policy": { "provisioningModel":"FLEX_START", "machineType": "MACHINE_TYPE", "reservation": "NO_RESERVATION" } } ], "location": { "allowedLocations": [ "ALLOWED_LOCATIONS" ] } }, "logsPolicy": { "destination": "CLOUD_LOGGING" } }Remplacez les éléments suivants :
INSTALL_GPU_DRIVERS: lorsque la valeur est définie surtrue, Batch récupère les pilotes requis pour le type de GPU que vous spécifiez dans le champpolicyà partir d'un emplacement tiers et les installe pour vous. Si vous définissez ce champ surfalse(valeur par défaut), vous devez installer manuellement les pilotes de GPU pour utiliser des GPU pour ce job.MACHINE_TYPE: type de machine GPU compatible avec les VM à démarrage flexible. Pour en savoir plus, consultez la section Disponibilité des options de consommation par type de machine dans la documentation Compute Engine.ALLOWED_LOCATIONS: vous pouvez éventuellement utiliser le champallowedLocations[]pour spécifier une région ou une ou plusieurs zones spécifiques d'une région dans laquelle les VM de votre job sont autorisées à s'exécuter. Par exemple,regions/us-central1autorise toutes les zones de la régionus-central1. Assurez-vous de spécifier des emplacements qui proposent le type de machine GPU que vous souhaitez pour ce job. Sinon, si vous omettez ce champ, assurez-vous que le type de machine GPU est disponible dans la région de la tâche.
Pour créer et exécuter le job, utilisez la commande
gcloud alpha batch jobs submit:gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILERemplacez les éléments suivants :
JOB_NAME: nom du job.LOCATION: emplacement du job.JSON_CONFIGURATION_FILE: chemin d'accès à un fichier JSON contenant les détails de configuration du job.
API
Envoyez une requête POST à la méthode jobs.create v1alpha qui installe les pilotes de GPU, spécifie un type de machine GPU compatible avec les VM Flex-start, bloque les réservations et s'exécute dans un emplacement compatible avec le type de machine GPU.
Par exemple, pour créer un job de script de base qui utilise des VM à démarrage flexible et des GPU pour les VM optimisées pour les accélérateurs, envoyez la requête suivante :
POST https://batch.googleapis.com/v1alpha/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}."
}
}
]
},
"taskCount": 3,
"parallelism": 1
}
],
"allocationPolicy": {
"instances": [
{
"installGpuDrivers": INSTALL_GPU_DRIVERS,
"policy": {
"provisioningModel":"FLEX_START",
"machineType": "MACHINE_TYPE",
"reservation": "NO_RESERVATION"
}
}
],
"location": {
"allowedLocations": [
"ALLOWED_LOCATIONS"
]
}
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Remplacez les éléments suivants :
PROJECT_ID: ID de votre projet.LOCATION: emplacement du job.JOB_NAME: nom du job.INSTALL_GPU_DRIVERS: lorsque la valeur est définie surtrue, Batch récupère les pilotes requis pour le type de GPU que vous spécifiez dans le champpolicyà partir d'un emplacement tiers et les installe pour vous. Si vous définissez ce champ surfalse(valeur par défaut), vous devez installer manuellement les pilotes de GPU pour utiliser des GPU pour ce job.MACHINE_TYPE: type de machine GPU compatible avec les VM à démarrage flexible. Pour en savoir plus, consultez la section Disponibilité des options de consommation par type de machine dans la documentation Compute Engine.ALLOWED_LOCATIONS: vous pouvez éventuellement utiliser le champallowedLocations[]pour spécifier une région ou une ou plusieurs zones spécifiques d'une région dans laquelle les VM de votre job sont autorisées à s'exécuter. Par exemple,regions/us-central1autorise toutes les zones de la régionus-central1. Assurez-vous de spécifier des emplacements qui proposent le type de machine GPU que vous souhaitez pour ce job. Sinon, si vous omettez ce champ, assurez-vous que le type de machine GPU est disponible dans la région de la tâche.
Utiliser des GPU pour les VM optimisées pour les accélérateurs
Vous pouvez créer un job qui utilise des GPU pour les VM optimisées pour les accélérateurs à l'aide de la consoleGoogle Cloud , de gcloud CLI, de l'API Batch, de Java, de Node.js ou de Python.
Console
Pour créer un job qui utilise des GPU à l'aide de la console Google Cloud , procédez comme suit :
Dans la console Google Cloud , accédez à la page Liste des jobs.
Cliquez sur Créer. La page Créer un job par lot s'ouvre. Dans le volet de gauche, la page Informations sur la tâche est sélectionnée.
Configurez la page Informations sur le job :
(Facultatif) Dans le champ Nom de la tâche, personnalisez le nom de la tâche.
Par exemple, saisissez
example-gpu-job.Configurez la section Détails de la tâche :
Dans la fenêtre Nouvel exécutable, ajoutez au moins un script ou un conteneur pour que ce job s'exécute.
Par exemple, pour créer un job de script de base, procédez comme suit :
Cochez la case Script. Un champ s'affiche.
Dans le champ, saisissez le script suivant :
echo Hello world from task ${BATCH_TASK_INDEX}.Cliquez sur OK.
Dans le champ Nombre de tâches, saisissez le nombre de tâches pour ce job.
Par exemple, saisissez
3.Facultatif : dans le champ Parallélisme, saisissez le nombre de tâches à exécuter simultanément.
Par exemple, saisissez
1(valeur par défaut).
Configurez la page Spécifications des ressources :
Dans le volet de gauche, cliquez sur Spécifications des ressources. La page Spécifications des ressources s'ouvre.
Dans la section Modèle de provisionnement de VM, sélectionnez l'une des options suivantes pour l'option de consommation des VM de ce job :
Si votre job peut résister à la préemption et que vous souhaitez bénéficier de VM Spot à prix réduit, sélectionnez Spot.
Sinon, pour utiliser des VM à la demande, sélectionnez Standard (par défaut).
Sélectionnez l'emplacement de ce job.
Dans le champ Région, sélectionnez une région.
Dans le champ Zone, effectuez l'une des opérations suivantes :
Si vous souhaitez limiter l'exécution de ce job à une zone spécifique, sélectionnez-en une.
Sinon, sélectionnez Tous (par défaut).
Sélectionnez le type de machine GPU pour les VM de ce job :
Dans les options de famille de machines, cliquez sur GPU.
Dans le champ Type de GPU, sélectionnez le type de GPU. Ensuite, dans le champ Nombre de GPU, sélectionnez le nombre de GPU pour chaque VM.
Si vous avez sélectionné l'un des types de GPU pour les VM optimisées pour les accélérateurs, le champ Type de machine ne propose qu'une seule option de type de machine en fonction du type et du nombre de GPU que vous avez sélectionnés.
Pour installer automatiquement les pilotes de GPU, sélectionnez Installation du pilote de GPU (par défaut).
Configurez la quantité de ressources de VM requise pour chaque tâche :
Dans le champ Cœurs, saisissez le nombre de vCPUs par tâche.
Par exemple, saisissez
1(valeur par défaut).Dans le champ Mémoire, saisissez la quantité de RAM en Go par tâche.
Par exemple, saisissez
0.5(valeur par défaut).
Cliquez sur OK.
Facultatif : Configurez les autres champs de ce job.
Facultatif : Pour examiner la configuration du job, cliquez sur Aperçu dans le volet de gauche.
Cliquez sur Créer.
La page Détails de la tâche affiche la tâche que vous avez créée.
gcloud
Créez un fichier JSON qui installe les pilotes GPU, spécifie un type de machine de la famille de machines optimisées pour les accélérateurs et s'exécute dans un emplacement disposant du type de machine GPU.
Par exemple, pour créer un job de script de base qui utilise des GPU pour les VM optimisées pour les accélérateurs, créez un fichier JSON avec le contenu suivant :
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}." } } ] }, "taskCount": 3, "parallelism": 1 } ], "allocationPolicy": { "instances": [ { "installGpuDrivers": INSTALL_GPU_DRIVERS, "policy": { "provisioningModel": "PROVISIONING_MODEL", "machineType": "MACHINE_TYPE", "reservation": "NO_RESERVATION" } } ], "location": { "allowedLocations": [ "ALLOWED_LOCATIONS" ] } }, "logsPolicy": { "destination": "CLOUD_LOGGING" } }Remplacez les éléments suivants :
INSTALL_GPU_DRIVERS: lorsque la valeur est définie surtrue, Batch récupère les pilotes requis pour le type de GPU que vous spécifiez dans le champpolicyà partir d'un emplacement tiers et les installe pour vous. Si vous définissez ce champ surfalse(valeur par défaut), vous devez installer manuellement les pilotes de GPU pour utiliser des GPU pour ce job.PROVISIONING_MODEL: modèle de provisionnement pour votre option de consommation :STANDARDpour les VM à la demande ouSPOTpour les VM Spot.MACHINE_TYPE: type de machine de la famille de machines optimisées pour les accélérateurs.ALLOWED_LOCATIONS: vous pouvez éventuellement utiliser le champallowedLocations[]pour spécifier une région ou une ou plusieurs zones spécifiques d'une région dans laquelle les VM de votre job sont autorisées à s'exécuter. Par exemple,regions/us-central1autorise toutes les zones de la régionus-central1. Assurez-vous de spécifier des emplacements qui proposent le type de machine GPU que vous souhaitez pour ce job. Sinon, si vous omettez ce champ, assurez-vous que le type de machine GPU est disponible dans la région de la tâche.
Pour créer et exécuter le job, utilisez la commande
gcloud batch jobs submit:gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILERemplacez les éléments suivants :
JOB_NAME: nom du job.LOCATION: emplacement du job.JSON_CONFIGURATION_FILE: chemin d'accès à un fichier JSON contenant les détails de configuration du job.
API
Envoyez une requête POST à la méthode jobs.create qui installe les pilotes GPU, spécifie un type de machine de la famille de machines optimisées pour les accélérateurs et s'exécute dans un emplacement disposant du type de machine GPU.
Par exemple, pour créer un job de script de base qui utilise des GPU pour les VM optimisées pour les accélérateurs, envoyez la requête suivante :
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}."
}
}
]
},
"taskCount": 3,
"parallelism": 1
}
],
"allocationPolicy": {
"instances": [
{
"installGpuDrivers": INSTALL_GPU_DRIVERS,
"policy": {
"provisioningModel": "PROVISIONING_MODEL",
"machineType": "MACHINE_TYPE",
"reservation": "NO_RESERVATION"
}
}
],
"location": {
"allowedLocations": [
"ALLOWED_LOCATIONS"
]
}
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Remplacez les éléments suivants :
PROJECT_ID: ID de votre projet.LOCATION: emplacement du job.JOB_NAME: nom du job.INSTALL_GPU_DRIVERS: lorsque la valeur est définie surtrue, Batch récupère les pilotes requis pour le type de GPU que vous spécifiez dans le champpolicyà partir d'un emplacement tiers et les installe pour vous. Si vous définissez ce champ surfalse(valeur par défaut), vous devez installer manuellement les pilotes de GPU pour utiliser des GPU pour ce job.PROVISIONING_MODEL: modèle de provisionnement pour votre option de consommation :STANDARDpour les VM à la demande ouSPOTpour les VM Spot.MACHINE_TYPE: type de machine de la famille de machines optimisées pour les accélérateurs.ALLOWED_LOCATIONS: vous pouvez éventuellement utiliser le champallowedLocations[]pour spécifier une région ou une ou plusieurs zones spécifiques d'une région dans laquelle les VM de votre job sont autorisées à s'exécuter. Par exemple,regions/us-central1autorise toutes les zones de la régionus-central1. Assurez-vous de spécifier des emplacements qui proposent le type de machine GPU que vous souhaitez pour ce job. Sinon, si vous omettez ce champ, assurez-vous que le type de machine GPU est disponible dans la région de la tâche.
Java
Node.js
Python
Utiliser des GPU pour les VM N1
Vous pouvez créer un job qui utilise des GPU pour les VM N1 à l'aide de la console Google Cloud , de gcloud CLI, de l'API Batch, de Java, de Node.js ou de Python.
Console
Pour créer un job qui utilise des GPU à l'aide de la console Google Cloud , procédez comme suit :
Dans la console Google Cloud , accédez à la page Liste des jobs.
Cliquez sur Créer. La page Créer un job par lot s'ouvre. Dans le volet de gauche, la page Informations sur la tâche est sélectionnée.
Configurez la page Informations sur le job :
(Facultatif) Dans le champ Nom de la tâche, personnalisez le nom de la tâche.
Par exemple, saisissez
example-gpu-job.Configurez la section Détails de la tâche :
Dans la fenêtre Nouvel exécutable, ajoutez au moins un script ou un conteneur pour que ce job s'exécute.
Par exemple, pour créer un job de script de base, procédez comme suit :
Cochez la case Script. Un champ s'affiche.
Dans le champ, saisissez le script suivant :
echo Hello world from task ${BATCH_TASK_INDEX}.Cliquez sur OK.
Dans le champ Nombre de tâches, saisissez le nombre de tâches pour ce job.
Par exemple, saisissez
3.Facultatif : dans le champ Parallélisme, saisissez le nombre de tâches à exécuter simultanément.
Par exemple, saisissez
1(valeur par défaut).
Configurez la page Spécifications des ressources :
Dans le volet de gauche, cliquez sur Spécifications des ressources. La page Spécifications des ressources s'ouvre.
Dans la section Modèle de provisionnement de VM, sélectionnez l'une des options suivantes pour l'option de consommation des VM de ce job :
Si votre job peut résister à la préemption et que vous souhaitez bénéficier de VM Spot à prix réduit, sélectionnez Spot.
Sinon, pour utiliser des VM à la demande, sélectionnez Standard (par défaut).
Sélectionnez l'emplacement de ce job.
Dans le champ Région, sélectionnez une région.
Dans le champ Zone, effectuez l'une des opérations suivantes :
Si vous souhaitez limiter l'exécution de ce job à une zone spécifique, sélectionnez-en une.
Sinon, sélectionnez Tous (par défaut).
Sélectionnez le type de machine GPU pour les VM de ce job :
Dans les options de famille de machines, cliquez sur GPU.
Dans le champ Type de GPU, sélectionnez le type de GPU.
Si vous avez sélectionné l'un des types de GPU pour les VM N1, le champ Série est défini sur N1.
Dans le champ Nombre de GPU, sélectionnez le nombre de GPU pour chaque VM.
Dans le champ Type de machine, sélectionnez le type de machine.
Pour installer automatiquement les pilotes de GPU, sélectionnez Installation du pilote de GPU (par défaut).
Configurez la quantité de ressources de VM requise pour chaque tâche :
Dans le champ Cœurs, saisissez le nombre de vCPUs par tâche.
Par exemple, saisissez
1(valeur par défaut).Dans le champ Mémoire, saisissez la quantité de RAM en Go par tâche.
Par exemple, saisissez
0.5(valeur par défaut).
Cliquez sur OK.
Facultatif : Configurez les autres champs de ce job.
Facultatif : Pour examiner la configuration du job, cliquez sur Aperçu dans le volet de gauche.
Cliquez sur Créer.
La page Détails de la tâche affiche la tâche que vous avez créée.
gcloud
Créez un fichier JSON qui installe les pilotes GPU, définit les sous-champs
typeetcountdu champaccelerators[], et s'exécute dans un emplacement disposant du type de machine GPU.Par exemple, pour créer un job de script de base qui utilise des GPU pour les VM N1 et permet à Batch de sélectionner le type de machine N1 exact, créez un fichier JSON avec le contenu suivant :
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}." } } ] }, "taskCount": 3, "parallelism": 1 } ], "allocationPolicy": { "instances": [ { "installGpuDrivers": INSTALL_GPU_DRIVERS, "policy": { "provisioningModel": "PROVISIONING_MODEL", "reservation": "NO_RESERVATION", "accelerators": [ { "type": "GPU_TYPE", "count": GPU_COUNT } ] } } ], "location": { "allowedLocations": [ "ALLOWED_LOCATIONS" ] } }, "logsPolicy": { "destination": "CLOUD_LOGGING" } }Remplacez les éléments suivants :
INSTALL_GPU_DRIVERS: lorsque la valeur est définie surtrue, Batch récupère les pilotes requis pour le type de GPU que vous spécifiez dans le champpolicyà partir d'un emplacement tiers et les installe pour vous. Si vous définissez ce champ surfalse(valeur par défaut), vous devez installer manuellement les pilotes de GPU pour utiliser des GPU pour ce job.PROVISIONING_MODEL: modèle de provisionnement pour votre option de consommation :STANDARDpour les VM à la demande ouSPOTpour les VM Spot.GPU_TYPE: type de GPU. Vous pouvez afficher la liste des types de GPU disponibles à l'aide de la commandegcloud compute accelerator-types list. N'utilisez ce champ que pour les GPU des VM N1.GPU_COUNT: nombre de GPU du type spécifié. Pour en savoir plus sur les options valides, consultez Types de machines GPU pour la série de machines N1. N'utilisez ce champ que pour les GPU des VM N1.ALLOWED_LOCATIONS: vous pouvez éventuellement utiliser le champallowedLocations[]pour spécifier une région ou une ou plusieurs zones spécifiques d'une région dans laquelle les VM de votre job sont autorisées à s'exécuter. Par exemple,regions/us-central1autorise toutes les zones de la régionus-central1. Assurez-vous de spécifier des emplacements qui proposent le type de machine GPU que vous souhaitez pour ce job. Sinon, si vous omettez ce champ, assurez-vous que le type de machine GPU est disponible dans la région de la tâche.
Pour créer et exécuter le job, utilisez la commande
gcloud batch jobs submit:gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILERemplacez les éléments suivants :
JOB_NAME: nom du job.LOCATION: emplacement du job.JSON_CONFIGURATION_FILE: chemin d'accès à un fichier JSON contenant les détails de configuration du job.
API
Envoyez une requête POST à la méthode jobs.create qui installe les pilotes de GPU, définit les sous-champs type et count du champ accelerators[] et utilise un emplacement qui possède le type de machine GPU.
Par exemple, pour créer un job de script de base qui utilise des GPU pour les VM N1 et permet à Batch de sélectionner le type de machine N1 exact, envoyez la requête suivante :
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}."
}
}
]
},
"taskCount": 3,
"parallelism": 1
}
],
"allocationPolicy": {
"instances": [
{
"installGpuDrivers": INSTALL_GPU_DRIVERS,
"policy": {
"provisioningModel": "PROVISIONING_MODEL",
"reservation": "NO_RESERVATION",
"accelerators": [
{
"type": "GPU_TYPE",
"count": GPU_COUNT
}
]
}
}
],
"location": {
"allowedLocations": [
"ALLOWED_LOCATIONS"
]
}
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Remplacez les éléments suivants :
PROJECT_ID: ID de votre projet.LOCATION: emplacement du job.JOB_NAME: nom du job.INSTALL_GPU_DRIVERS: lorsque la valeur est définie surtrue, Batch récupère les pilotes requis pour le type de GPU que vous spécifiez dans le champpolicyà partir d'un emplacement tiers et les installe pour vous. Si vous définissez ce champ surfalse(valeur par défaut), vous devez installer manuellement les pilotes de GPU pour utiliser des GPU pour ce job.PROVISIONING_MODEL: modèle de provisionnement pour votre option de consommation :STANDARDpour les VM à la demande ouSPOTpour les VM Spot.GPU_TYPE: type de GPU. Vous pouvez afficher la liste des types de GPU disponibles à l'aide de la commandegcloud compute accelerator-types list. N'utilisez ce champ que pour les GPU des VM N1.GPU_COUNT: nombre de GPU du type spécifié. Pour en savoir plus sur les options valides, consultez Types de machines GPU pour la série de machines N1. N'utilisez ce champ que pour les GPU des VM N1.ALLOWED_LOCATIONS: vous pouvez éventuellement utiliser le champallowedLocations[]pour spécifier une région ou une ou plusieurs zones spécifiques d'une région dans laquelle les VM de votre job sont autorisées à s'exécuter. Par exemple,regions/us-central1autorise toutes les zones de la régionus-central1. Assurez-vous de spécifier des emplacements qui proposent le type de machine GPU que vous souhaitez pour ce job. Sinon, si vous omettez ce champ, assurez-vous que le type de machine GPU est disponible dans la région de la tâche.
Java
Node.js
Python
Étapes suivantes
- Si vous rencontrez des problèmes pour créer ou exécuter un job, consultez la section Dépannage.
- Afficher les jobs et les tâches
- Découvrez d'autres options de création de tâches.