Quando crei un cluster Dataproc, le risorse del cluster utilizzano un endpoint regionale basato su zone di Compute Engine. Quando scegli una regione, puoi selezionare una zona all'interno di quella regione oppure puoi omettere la zona per fare in modo che la funzionalità Zona automatica di Dataproc selezioni una zona per te in quella regione. Una volta selezionata una zona, tutti i nodi del cluster verranno sottoposti a deployment in quella zona.
Puoi escludere le zone dai criteri di selezione della zona automatica a condizione che la regione del cluster includa almeno due zone non escluse. Per saperne di più, consulta Utilizzare il posizionamento della zona automatica.
Zona automatica e prenotazioni di risorse
La zona automatica dà la priorità alla creazione di un cluster in una zona con prenotazioni di risorse, come segue:
Se le risorse del cluster richieste possono essere soddisfatte completamente dalle risorse riservate e, se necessario, dalle risorse on demand in una zona, la zona automatica utilizzerà le risorse riservate e on demand e creerà il cluster in quella zona.
La zona automatica dà la priorità alle zone per la selezione in base alle prenotazioni totali di core CPU (
vCPU) in una zona.Esempio: una richiesta di creazione del cluster specifica 20
n2-standard-2e 1n2-standard-64(40 + 64vCPUsrichieste). La zona automatica darà la priorità alle seguenti zone per la selezione in base alle prenotazioni totali di vCPU disponibili nella zona:zone-cprenotazioni disponibili: 3n2-standard-2e 1n2-standard-64(70vCPUs)zone-bprenotazioni disponibili: 1n2-standard-64(64vCPUs)zone-aprenotazioni disponibili: 25n2-standard-2(50vCPUs)Supponendo che ciascuna di queste zone disponga di
vCPUon demand aggiuntive e di altre risorse sufficienti a soddisfare la richiesta del cluster, la zona automatica selezioneràzone-cper la creazione del cluster.
Se le risorse del cluster richieste non possono essere soddisfatte completamente dalle risorse riservate e on demand in una zona, la zona automatica creerà il cluster in una zona che ha maggiori probabilità di soddisfare la richiesta utilizzando le risorse on demand.
Utilizzare il posizionamento della zona automatica
Console
Per creare un cluster Dataproc che utilizza il posizionamento della zona automatica:
- Nella Google Cloud console, apri la pagina Crea un cluster Dataproc su Compute Engine di Dataproc. Viene selezionato il riquadro Configura cluster.
- Nella sezione Località, procedi nel seguente modo:
- Seleziona una regione per il cluster.
- In Zona, seleziona "Qualsiasi".
Escludere le zone: la specifica delle zone da escludere dal posizionamento della zona automatica non è supportata tramite la Google Cloud console. Questa funzionalità è disponibile utilizzando Google Cloud CLI e l'API REST.
Interfaccia a riga di comando gcloud
Per creare un cluster Dataproc che utilizza il posizionamento della zona automatica, utilizza il
gcloud dataproc clusters create
comando. Imposta il flag --region su una regione, quindi
omettere il flag --zone o impostare il flag --zone su
una stringa vuota (--zone="").
--auto-zone-exclude-zones flag per specificare un elenco di zone separate da virgole. La selezione della zona automatica selezionerà una zona dalla regione specificata,
ma escluderà le zone elencate dai criteri di selezione. Tieni presente che
nella regione del cluster devono essere disponibili almeno due zone non escluse.
Esempi:
Utilizzo di base della zona automatica:
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ other args ...
Zona automatica con zone escluse:
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ --auto-zone-exclude-zones=ZONE_1,ZONE_2 \ other args ...
API REST
Per creare un cluster Dataproc che utilizza il posizionamento della zona automatica,
crea una richiesta API clusters.create
JSON, lasciando vuoto il campo
gceClusterConfig.zoneUri. Nell'endpoint REST,
https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, inserisci un nome di regione. La zona automatica di Dataproc sceglierà
una zona per il cluster all'interno della regione specificata.
Per escludere zone specifiche, puoi compilare il gceClusterConfig.autoZoneExcludeZoneUris con un elenco di nomi di zone da escludere. Tieni presente che nella regione del cluster devono essere disponibili almeno due zone non escluse.
Utilizzare nomi di risorse brevi con il posizionamento della zona automatica: quando specifichi un URI di risorsa, ad esempio machineTypeUri o acceleratorTypeUri, in una richiesta di creazione del cluster dell'API REST di posizionamento della zona automatica, utilizza un nome di risorsa breve senza una specifica della zona, ad esempio "n1-standard-2" o "nvidia-tesla-t4".