Dataproc-Cluster mit Clientbibliotheken erstellen
Der unten aufgeführte Beispielcode zeigt Ihnen, wie Sie mit den Cloud-Clientbibliotheken einen Dataproc-Cluster erstellen, einen Job im Cluster ausführen und anschließend den Cluster löschen.
Sie können die Aufgaben auch hiermit ausführen:
- API REST-Anfragen in Kurzanleitung: API Explorer verwenden
- Google Cloud -Console in Dataproc-Cluster mit der Google Cloud -Console erstellen
- die Google Cloud CLI in Dataproc-Cluster mit der Google Cloud CLI erstellen
Hinweis
- Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Dataproc API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Dataproc API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Code ausführen
Anleitung ausprobieren:Klicken Sie auf In Cloud Shell öffnen, um eine Python-Anleitung für Cloud-Clientbibliotheken auszuführen, in der ein Cluster erstellt, ein PySpark-Job ausgeführt und der Cluster dann gelöscht wird.
Go
- Installieren Sie die Clientbibliothek. Weitere Informationen finden Sie unter Entwicklungsumgebung einrichten.
- Authentifizierung einrichten
- Klonen Sie GitHub-Beispielcode und führen Sie ihn aus.
Java
- Installieren Sie die Clientbibliothek. Weitere Informationen finden Sie unter Java-Entwicklungsumgebung einrichten.
- Authentifizierung einrichten
- Klonen Sie GitHub-Beispielcode und führen Sie ihn aus.
Node.js
- Installieren Sie die Clientbibliothek. Weitere Informationen finden Sie unter Node.js-Entwicklungsumgebung einrichten.
- Authentifizierung einrichten
- Klonen Sie GitHub-Beispielcode und führen Sie ihn aus.
Python
- Installieren Sie die Clientbibliothek. Weitere Informationen finden Sie unter Python-Entwicklungsumgebung einrichten.
- Authentifizierung einrichten
- Klonen Sie GitHub-Beispielcode und führen Sie ihn aus.
Ausgabe ansehen
Der Code gibt das Jobtreiberlog an den standardmäßigen Dataproc-Staging-Bucket in Cloud Storage aus. Sie können die Jobtreiberausgabe in der Google Cloud -Konsole auf der Seite Jobs Ihres Projekts in der Google Cloud -Konsole aufrufen. Klicken Sie auf die Job-ID, um die Jobausgabe auf der Seite Jobdetails aufzurufen.
Nächste Schritte
- Weitere Informationen finden Sie in der Dataproc Cloud-Clientbibliothek unter Zusätzliche Ressourcen.