Vous pouvez copier la configuration d'un cluster virtuel Dataproc sur GKE existant, la mettre à jour, puis créer un cluster Dataproc sur GKE à l'aide de la configuration mise à jour.
Recréer et mettre à jour un cluster Dataproc sur GKE
gcloud
Définissez les variables d'environnement :
CLUSTER=existing Dataproc on GKE cluster name \ REGION=region
Exportez la configuration du cluster Dataproc sur GKE existant dans un fichier YAML.
gcloud dataproc clusters export $CLUSTER \ --region=$REGION > "${CLUSTER}-config.yaml"Mettez à jour la configuration.
Supprimez le
kubernetesNamespacechamp. Cette suppression est nécessaire pour éviter un conflit d'espace de noms lorsque vous créez le cluster mis à jour.Exemple de commande
sedpour supprimer le champkubernetesNamespace:sed -E "s/kubernetesNamespace: .+$//g" ${CLUSTER}-config.yamlApportez des modifications supplémentaires pour mettre à jour les paramètres de configuration du cluster virtuel Dataproc sur GKE, par exemple en modifiant la valeur de componentVersion de Spark .
Supprimez le cluster virtuel Dataproc sur GKE existant si vous créez un cluster qui porte le même nom que celui qu'il met à jour (si vous remplacez le cluster d'origine).
Attendez la fin de l'opération de suppression précédente, puis importez la configuration du cluster mise à jour pour créer un cluster virtuel Dataproc sur GKE avec les paramètres de configuration mis à jour.
gcloud dataproc clusters import $CLUSTER \ --region=$REGION \ --source="${CLUSTER}-config.yaml"
API
Définissez les variables d'environnement :
CLUSTER=existing Dataproc on GKE cluster name \ REGION=region
Exportez la configuration du cluster Dataproc sur GKE existant dans un fichier YAML.
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters/${CLUSTER}?alt=json" > "${CLUSTER}-config.json"Mettez à jour la configuration.
Supprimez le
kubernetesNamespacechamp. Cette suppression est nécessaire pour éviter un conflit d'espace de noms lorsque vous créez le cluster mis à jour.Exemple de commande
jqpour supprimer le champkubernetesNamespace:jq 'del(.virtualClusterConfig.kubernetesClusterConfig.kubernetesNamespace)'
Apportez des modifications supplémentaires pour mettre à jour les paramètres de configuration du cluster virtuel Dataproc sur GKE, par exemple en modifiant la valeur de componentVersion de Spark .
Supprimez le cluster virtuel Dataproc sur GKE existant si vous créez un cluster portant le même nom que celui qu'il met à jour (si vous remplacez le cluster d'origine).
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters/${CLUSTER}"Attendez la fin de l'opération de suppression précédente, et puis importez la configuration du cluster mise à jour pour créer un nouveau cluster virtuel Dataproc sur GKE avec les paramètres mis à jour.
curl -i -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json; charset=utf-8" -d "@${CLUSTER}-config.json" "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters?alt=json"
Console
La Google Cloud console ne permet pas de recréer un cluster virtuel Dataproc sur GKE en important la configuration d'un cluster existant.