Puoi copiare la configurazione di un cluster virtuale Dataproc su GKE esistente, aggiornarla e poi creare un nuovo cluster Dataproc su GKE utilizzando la configurazione aggiornata.
Ricrea e aggiorna un cluster Dataproc su GKE
gcloud
Imposta le variabili di ambiente:
CLUSTER=existing Dataproc on GKE cluster name \ REGION=region
Esporta la configurazione del cluster Dataproc su GKE esistente in un file YAML.
gcloud dataproc clusters export $CLUSTER \ --region=$REGION > "${CLUSTER}-config.yaml"Aggiorna la configurazione.
Rimuovi il
kubernetesNamespacecampo. La rimozione di questo campo è necessaria per evitare un conflitto di spazi dei nomi quando crei il cluster aggiornato.Esempio di comando
sedper rimuovere il campokubernetesNamespace:sed -E "s/kubernetesNamespace: .+$//g" ${CLUSTER}-config.yamlApporta modifiche aggiuntive per aggiornare le impostazioni di configurazione del cluster virtuale Dataproc su GKE, ad esempio modificando la versione del componente Spark componentVersion.
Elimina il cluster virtuale Dataproc su GKE esistente se crei un cluster che ha lo stesso nome del cluster che stai aggiornando (se stai sostituendo il cluster originale).
Attendi il completamento dell'operazione di eliminazione precedente, quindi importa la configurazione del cluster aggiornata per creare un nuovo cluster virtuale Dataproc su GKE con le impostazioni di configurazione aggiornate.
gcloud dataproc clusters import $CLUSTER \ --region=$REGION \ --source="${CLUSTER}-config.yaml"
API
Imposta le variabili di ambiente:
CLUSTER=existing Dataproc on GKE cluster name \ REGION=region
Esporta la configurazione del cluster Dataproc su GKE esistente in un file YAML.
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters/${CLUSTER}?alt=json" > "${CLUSTER}-config.json"Aggiorna la configurazione.
Rimuovi il
kubernetesNamespacecampo. La rimozione di questo campo è necessaria per evitare un conflitto di spazi dei nomi quando crei il cluster aggiornato.Esempio di comando
jqper rimuovere il campokubernetesNamespace:jq 'del(.virtualClusterConfig.kubernetesClusterConfig.kubernetesNamespace)'
Apporta modifiche aggiuntive per aggiornare le impostazioni di configurazione del cluster virtuale Dataproc su GKE, ad esempio modificando la versione del componente Spark componentVersion.
Elimina il cluster virtuale Dataproc su GKE esistente se crei un cluster con lo stesso nome del cluster che stai aggiornando (se stai sostituendo il cluster originale).
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters/${CLUSTER}"Attendi il completamento dell'operazione di eliminazione precedente, e quindi importa la configurazione del cluster aggiornata per creare un nuovo cluster virtuale Dataproc su GKE con le impostazioni aggiornate.
curl -i -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json; charset=utf-8" -d "@${CLUSTER}-config.json" "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters?alt=json"
Console
La Google Cloud console non supporta la ricreazione di un cluster virtuale Dataproc su GKE importando la configurazione di un cluster esistente.