Crea un cluster
Requisiti:
Nome: il nome del cluster deve iniziare con una lettera minuscola seguita da un numero massimo di 51 lettere minuscole, numeri e trattini e non può terminare con un trattino.
Regione del cluster: devi specificare una regione Compute Engine per il cluster, ad esempio
us-east1oeurope-west1, per isolare le risorse del cluster, come le istanze VM e i metadati del cluster archiviati in Cloud Storage, all'interno della regione.- Per saperne di più sulle regioni Compute Engine, consulta Regione del cluster per altre informazioni.
- Per informazioni sulla selezione di una regione, consulta Regioni e zone disponibili. Puoi anche eseguire il comando
gcloud compute regions listper visualizzare un elenco delle regioni disponibili.
Connettività: le istanze di macchine virtuali Compute Engine (VM) in un cluster Managed Service for Apache Spark, composto da VM master e worker, richiedono una connettività incrociata di rete IP interna completa. La rete VPC
defaultfornisce questa connettività (vedi Configurazione della rete del cluster Managed Service for Apache Spark).Tipo di macchina (consigliato): anche se la specifica di un tipo di macchina è facoltativa, Google consiglia di selezionare esplicitamente un tipo di macchina per le VM master e worker nel cluster. Se non specifichi un tipo di macchina, Managed Service for Apache Spark seleziona dinamicamente i tipi di macchina in base alla disponibilità delle risorse. Questa selezione dinamica può comportare variazioni sia in termini di costi che di prestazioni.
- Per saperne di più sulla scelta di un tipo di macchina, consulta Tipi di macchina supportati.
- Per mitigare i potenziali problemi di indisponibilità delle risorse, ti consigliamo di utilizzare le VM flessibili, che ti consentono di specificare un elenco di tipi di macchina accettabili.
Console
Apri la pagina della Google Cloud console Crea cluster per visualizzare le impostazioni predefinite del cluster. Puoi confermare o modificare le impostazioni predefinite visualizzate, quindi fare clic su Configurazione aggiuntiva per personalizzare ulteriormente il cluster.
Fai clic su Crea cluster per creare il cluster. Il nome del cluster viene visualizzato nella pagina Cluster e il relativo stato viene aggiornato a Running dopo il provisioning del cluster. Fai clic sul nome del cluster per aprire la pagina dei dettagli del cluster, dove puoi esaminare i job, le istanze e le impostazioni di configurazione del cluster e connetterti alle interfacce web in esecuzione sul cluster.
gcloud
Per creare un cluster Managed Service for Apache Spark dalla riga di comando, esegui il comando gcloud dataproc clusters create localmente in una finestra del terminale o in Cloud Shell.
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ --master-machine-type=MASTER_MACHINE_TYPE \ --worker-machine-type=WORKER_MACHINE_TYPE
Il comando crea un cluster. Anche se i tipi di macchina master e worker sono facoltativi, ti consigliamo di specificarli esplicitamente utilizzando i flag --master-machine-type e --worker-machine-type (ad esempio, n4-standard-4) per garantire costi e prestazioni coerenti. Se non specifichi i tipi di macchina, i tipi di macchina predefiniti vengono selezionati dinamicamente in base alla disponibilità delle risorse. Per informazioni sull'utilizzo dei flag della riga di comando per personalizzare le impostazioni del cluster, consulta il comando
gcloud dataproc clusters create.
Crea un cluster con un file YAML
- Esegui il seguente comando
gcloudper esportare la configurazione di un cluster Managed Service for Apache Spark esistente in un filecluster.yaml.gcloud dataproc clusters export EXISTING_CLUSTER_NAME \ --region=REGION \ --destination=cluster.yaml
- Crea un nuovo cluster importando la configurazione del file YAML.
gcloud dataproc clusters import NEW_CLUSTER_NAME \ --region=REGION \ --source=cluster.yaml
**Nota:** durante l'operazione di esportazione, i campi specifici del cluster, come il nome del cluster, i campi di sola uscita e le etichette applicate automaticamente, vengono filtrati. Questi campi non sono consentiti nel file YAML importato utilizzato per creare un cluster.
REST
Questa sezione mostra come creare un cluster. Anche se la specifica dei tipi di macchina è facoltativa, ti consigliamo di includere esplicitamente machine_type_uri in master_config e worker_config (ad esempio, n4-standard-4) per garantire costi e prestazioni coerenti. Se non specifichi i tipi di macchina, i tipi di macchina predefiniti vengono selezionati dinamicamente in base alla disponibilità delle risorse.
Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:
- CLUSTER_NAME: nome del cluster
- PROJECT: Google Cloud ID progetto
- REGION: una regione Compute Engine disponibile in cui verrà creato il cluster.
- ZONE: una zona facoltativa all'interno della regione selezionata in cui verrà creato il cluster.
- MASTER_MACHINE_TYPE: (consigliato) il tipo di macchina per il nodo master (ad esempio,
n4-standard-4). - WORKER_MACHINE_TYPE: (consigliato) il tipo di macchina per i nodi worker (ad esempio,
n4-standard-4).
Metodo HTTP e URL:
POST https://dataproc.googleapis.com/v1/projects/PROJECT/regions/REGION/clusters
Corpo JSON della richiesta:
{
"project_id":"PROJECT",
"cluster_name":"CLUSTER_NAME",
"config":{
"master_config":{
"num_instances":1,
"machine_type_uri":"MASTER_MACHINE_TYPE",
"image_uri":""
},
"softwareConfig": {
"imageVersion": "",
"properties": {},
"optionalComponents": []
},
"worker_config":{
"num_instances":2,
"machine_type_uri":"WORKER_MACHINE_TYPE",
"image_uri":""
},
"gce_cluster_config":{
"zone_uri":"ZONE"
}
}
}
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{
"name": "projects/PROJECT/regions/REGION/operations/b5706e31......",
"metadata": {
"@type": "type.googleapis.com/google.cloud.dataproc.v1.ClusterOperationMetadata",
"clusterName": "CLUSTER_NAME",
"clusterUuid": "5fe882b2-...",
"status": {
"state": "PENDING",
"innerState": "PENDING",
"stateStartTime": "2019-11-21T00:37:56.220Z"
},
"operationType": "CREATE",
"description": "Create cluster with 2 workers",
"warnings": [
"For PD-Standard without local SSDs, we strongly recommend provisioning 1TB ...""
]
}
}
Go
- Installa la libreria client.
- Configura le credenziali predefinite dell'applicazione.
- Esegui il codice.
Nota: anche se la specifica dei tipi di macchina è facoltativa, ti consigliamo di impostare esplicitamente i tipi di macchina master e worker nella configurazione del cluster (ad esempio, su
n4-standard-4) per garantire costi e prestazioni coerenti. Se omessi, i tipi di macchina predefiniti vengono selezionati dinamicamente in base alla disponibilità delle risorse.
Java
- Installa la libreria client.
- Configura le credenziali predefinite dell'applicazione.
- Esegui il codice.
Nota: anche se la specifica dei tipi di macchina è facoltativa, ti consigliamo di impostare esplicitamente i tipi di macchina master e worker nella configurazione del cluster (ad esempio, su
n4-standard-4) per garantire costi e prestazioni coerenti. Se omessi, i tipi di macchina predefiniti vengono selezionati dinamicamente in base alla disponibilità delle risorse.
Node.js
- Installa la libreria client.
- Configura le credenziali predefinite dell'applicazione.
- Esegui il codice.
Nota: anche se la specifica dei tipi di macchina è facoltativa, ti consigliamo di impostare esplicitamente i tipi di macchina master e worker nella configurazione del cluster (ad esempio, su
n4-standard-4) per garantire costi e prestazioni coerenti. Se omessi, i tipi di macchina predefiniti vengono selezionati dinamicamente in base alla disponibilità delle risorse.
Python
- Installa la libreria client.
- Configura le credenziali predefinite dell'applicazione.
- Esegui il codice.
Nota: anche se la specifica dei tipi di macchina è facoltativa, ti consigliamo di impostare esplicitamente i tipi di macchina master e worker nella configurazione del cluster (ad esempio, su
n4-standard-4) per garantire costi e prestazioni coerenti. Se omessi, i tipi di macchina predefiniti vengono selezionati dinamicamente in base alla disponibilità delle risorse.