Quando crei un cluster Dataproc, specifichi una regione di Compute Engine, ad esempio "us-east1" o "europe-west1". Dataproc isolerà le risorse del cluster, come le istanze VM e Cloud Storage e l'archiviazione dei metadati, all'interno di una zona della regione specificata.
Quando crei un cluster, puoi specificare facoltativamente una zona all'interno della regione del cluster specificata, ad esempio "us-east1-a" o "europe-west1-b". Se non specifichi la zona, il posizionamento automatico delle zone di Dataproc sceglierà una zona all'interno della regione del cluster specificata per individuare le risorse dei cluster.
Lo spazio dei nomi regionale corrisponde al segmento /regions/REGION
degli URI delle risorse Dataproc (vedi, ad esempio, il
cluster
networkUri).
Nomi regioni
I nomi delle regioni seguono una convenzione di denominazione standard basata sulle
regioni Compute Engine.
Ad esempio, il nome della regione Stati Uniti centrali è us-central1 e il nome della regione Europa occidentale è europe-west1. Esegui il comando gcloud compute regions list
per visualizzare un elenco delle regioni disponibili.
Endpoint regionali e di località
Le APIGoogle Cloud possono fornire supporto per endpoint basati sulla posizione e regionali:
Gli endpoint basati sulla posizione garantiscono che i dati in transito rimangano nella posizione specificata quando vengono accessibili tramite connettività privata.
Formato:
{location}-{service}.googleapis.comEsempio:
us-central-1-dataproc.googleapis.comGli endpoint regionali garantiscono che i dati in transito rimangano nella posizione specificata quando vi si accede tramite connettività privata o internet pubblico.
Formato:
{service}.{location}.rep.googleapis.comEsempio:
dataproc.us-central1.rep.googleapis.com
L'endpoint Dataproc predefinito è endpoint di località. Consulta le note di rilascio di Dataproc per gli annunci sul supporto degli endpoint regionali di Dataproc.
Crea un cluster
Interfaccia a riga di comando gcloud
Quando crei un cluster, specifica una regione utilizzando il flag
--region obbligatorio.
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ other args ...
API REST
Utilizza il parametro URL REGION in una richiesta
clusters.create
per specificare la regione del cluster.
gRPC
Imposta l'indirizzo di trasporto del client sull'endpoint localizzato utilizzando il seguente pattern:
REGION-dataproc.googleapis.com
Esempio Python (google-cloud-python):
from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport
transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)
project_id = 'my-project'
region = 'us-central1'
cluster = {...}Esempio Java (google-cloud-java):
ClusterControllerSettings settings =
ClusterControllerSettings.newBuilder()
.setEndpoint("us-central1-dataproc.googleapis.com:443")
.build();
try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
String projectId = "my-project";
String region = "us-central1";
Cluster cluster = Cluster.newBuilder().build();
Cluster response =
clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
}Console
Specifica una regione Dataproc nella sezione Località del riquadro Configura cluster nella pagina Dataproc Crea un cluster nella console Google Cloud .
Passaggi successivi
- Area geografica e regioni
- Compute Engine→Regioni e zone
- Compute Engine→Risorse globali, regionali e di zona
- Posizionamento automatico della zona di Dataproc