"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Clusterregion

Wenn Sie einen Managed Service for Apache Spark-Cluster erstellen, geben Sie eine Compute Engine-Region an, z. B. „us-east1“ oder „europe-west1“. Managed Service for Apache Spark isoliert Clusterressourcen wie VM-Instanzen, Cloud Storage und Metadatenspeicher in einer Zone innerhalb der angegebenen Region.

Optional können Sie beim Erstellen eines Clusters eine Zone innerhalb der angegebenen Clusterregion angeben, z. B. „us-east1-a“ oder „europe-west1-b“. Wenn Sie die Zone nicht angeben, wählt die automatische Zonenplatzierung von Managed Service for Apache Spark eine Zone innerhalb der angegebenen Clusterregion aus, um Cluster Ressourcen zu platzieren.

Der regionale Namespace entspricht dem /regions/REGION Segment der Managed Service for Apache Spark-Ressourcen-URIs (siehe z. B. den Cluster networkUri).

Regionsnamen

Namen von Regionen folgen einer Standard-Namenskonvention basierend auf Compute Engine-Regionen. Beispiel: Der Name für die zentrale Region der USA lautet us-central1 und der Name der Region Westeuropa ist europe-west1. Führen Sie den Befehl gcloud compute regions list aus, um eine Liste der verfügbaren Regionen anzuzeigen.

Standort- und regionale Endpunkte

Google Cloud APIs können Standort - und regionale Endpunkte unterstützen:

Standortendpunkte sorgen dafür, dass Daten bei der Übertragung an dem angegebenen Standort verbleiben, wenn sie über eine private Verbindung aufgerufen werden.

Format: {location}-{service}.googleapis.com

Beispiel: us-central-1-dataproc.googleapis.com
Regionale Endpunkte sorgen dafür, dass Daten bei der Übertragung an dem angegebenen Standort verbleiben, wenn sie entweder über eine private Verbindung oder das öffentliche Internet aufgerufen werden.

Format: {service}.{location}.rep.googleapis.com

Beispiel: dataproc.us-central1.rep.googleapis.com

Der Standardendpunkt für Managed Service for Apache Spark ist ein Standortendpunkt. In den Versionshinweisen zu Managed Service for Apache Spark finden Sie Ankündigungen zur Unterstützung regionaler Endpunkte durch Managed Service for Apache Spark.

Cluster erstellen

Console

Geben Sie in der Google Cloud Console auf der Cluster erstellenSeite im Cluster definierenBereich im RegionFeld eine Compute Engine-Region an.

gcloud CLI

Wenn Sie einen Cluster erstellen, geben Sie mit dem erforderlichen Flag --region eine Region an.

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    other args ...

REST API

Verwenden Sie den REGION URL-Parameter in einer clusters.create Anfrage, um die Clusterregion anzugeben.

gRPC

Legen Sie die Client-Transportadresse mit dem folgenden Muster auf den Standortendpunkt fest:

REGION-dataproc.googleapis.com

Python (google-cloud-python) Beispiel:

from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport

transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
    address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)

project_id = 'my-project'
region = 'us-central1'
cluster = {...}

Java(google-cloud-java) Beispiel

ClusterControllerSettings settings =
     ClusterControllerSettings.newBuilder()
        .setEndpoint("us-central1-dataproc.googleapis.com:443")
        .build();
 try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
   String projectId = "my-project";
   String region = "us-central1";
   Cluster cluster = Cluster.newBuilder().build();
   Cluster response =
       clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
 }