Lorsque vous créez un cluster Dataproc, vous spécifiez une région Compute Engine comme emplacement du cluster. Vous pouvez également spécifier une zone dans cette région, ou omettre la zone pour que la fonctionnalité de sélection de zone automatique de Dataproc en choisisse une pour vous dans la région spécifiée. Tous les nœuds du cluster sont déployés dans la zone sélectionnée.
Vous pouvez exclure des zones des critères de sélection sélection de zone automatique si la région du cluster inclut au moins deux zones non exclues. Pour en savoir plus, consultez Utiliser la sélection de zone automatique.
Réservations de ressources et de sélection de zone automatique
La fonctionnalité sélection de zone automatique donne la priorité à la création d'un cluster dans une zone avec des réservations de ressources, comme suit :
Si les ressources de cluster demandées peuvent être entièrement satisfaites par les ressources réservées, plus, si nécessaire, les ressources à la demande dans une zone, sélection de zone automatique consommera les ressources réservées et à la demande, et créera le cluster dans cette zone.
La sélection sélection de zone automatique donne la priorité aux zones en fonction du nombre total de cœurs de processeur (
vCPU) réservés dans une zone.Exemple : Une requête de création de cluster spécifie 20
n2-standard-2et 1n2-standard-64(40 + 64vCPUsdemandés). La sélection de zone automatique donne la priorité aux zones suivantes en fonction du nombre total de réservations de processeurs virtuels disponibles dans la zone :- Réservations
zone-cdisponibles : 3n2-standard-2et 1n2-standard-64(70vCPUs) zone-bréservations disponibles : 1n2-standard-64(64vCPUs)zone-aréservations disponibles : 25n2-standard-2(50vCPUs)En supposant que chacune de ces zones dispose de
vCPUà la demande supplémentaires et d'autres ressources suffisantes pour répondre à la demande du cluster, la sélection sélection de zone automatique choisirazone-cpour la création du cluster.
- Réservations
Si les ressources de cluster demandées ne peuvent pas être entièrement satisfaites par les ressources réservées et à la demande dans une zone, la sélection de zone automatique créera le cluster dans une zone qui est la plus susceptible de répondre à la demande à l'aide de ressources à la demande.
Utiliser la sélection de zone automatique
Console
Pour créer un cluster Dataproc qui utilise la sélection de zone automatique :
- Dans la console Google Cloud , ouvrez la page Dataproc Créer un cluster Dataproc sur Compute Engine. Le panneau Configurer un cluster est sélectionné.
- Dans la section Emplacement, procédez comme suit :
- Sélectionnez une région pour votre cluster.
- Sous Zone, sélectionnez "Toutes".
Exclure des zones : il n'est pas possible de spécifier des zones à exclure de la sélection sélection de zone automatique via la console Google Cloud . Cette fonctionnalité est disponible avec Google Cloud CLI et l'API REST.
gcloud CLI
Pour créer un cluster Dataproc qui utilise la sélection de zone automatique, exécutez la commande gcloud dataproc clusters create. Définissez l'indicateur --region sur une région, puis omettez l'indicateur --zone ou définissez-le sur une chaîne vide (--zone="").--zone
--auto-zone-exclude-zones pour spécifier une liste de zones séparées par une virgule. La sélection sélection de zone automatique choisit une zone dans la région spécifiée, mais exclut les zones listées de ses critères de sélection. Notez qu'au moins deux zones non exclues doivent être disponibles dans la région du cluster.
Exemples :
Utilisation de base de la sélection de zone automatique :
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ other args ...
Sélection de zone automatique avec zones exclues :
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ --auto-zone-exclude-zones=ZONE_1,ZONE_2 \ other args ...
API REST
Pour créer un cluster Dataproc qui utilise la sélection de zone automatique, créez une requête API clusters.create au format JSON, en laissant le champ gceClusterConfig.zoneUri vide. Dans le point de terminaison REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, insérez un nom de région. La fonctionnalité de sélection de zone automatique de Dataproc choisit une zone pour le cluster dans la région spécifiée.
Pour exclure des zones spécifiques, vous pouvez renseigner le champ gceClusterConfig.autoZoneExcludeZoneUris avec une liste de noms de zones à exclure. Notez qu'au moins deux zones non exclues doivent être disponibles dans la région du cluster.
Utiliser des noms de ressources courts avec la sélection de zone automatique : lorsque vous spécifiez un URI de ressource, tel que machineTypeUri ou acceleratorTypeUri, dans une requête API REST de création de cluster avec sélection de zone automatique, utilisez un nom de ressource court sans spécification de zone, par exemple "n1-standard-2" ou "nvidia-tesla-t4".