Crea un cluster utilizzando le librerie client
Il codice campione elencato di seguito mostra come utilizzare le librerie client di Cloud per creare un cluster Managed Service per Apache Spark, eseguire un job sul cluster e poi eliminare il cluster.
Puoi eseguire queste attività anche utilizzando:
- Richieste API REST nelle guide rapide utilizzando Explorer API
- la Google Cloud consolenella sezione Crea un cluster utilizzando la Google Cloud console
- Google Cloud CLI in Crea un cluster utilizzando Google Cloud CLI
Prima di iniziare
- Accedi al tuo Google Cloud account. Se non hai mai utilizzato Google Cloud, crea un account per valutare il rendimento dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Dataproc API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Dataproc API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Esegui il codice
Prova la procedura dettagliata: fai clic su Apri in Cloud Shell per eseguire una procedura dettagliata delle librerie client di Cloud per Python che crea un cluster, esegue un job PySpark e poi elimina il cluster.
Go
- Installa la libreria client Per ulteriori informazioni, consulta Configurare l'ambiente di sviluppo.
- Configura l'autenticazione
- Clona ed esegui il codice di esempio di GitHub.
Java
- Installa la libreria client Per ulteriori informazioni, consulta Configurare un ambiente di sviluppo Java.
- Configura l'autenticazione
- Clona ed esegui il codice di esempio di GitHub.
Node.js
- Installa la libreria client Per ulteriori informazioni, consulta Configurare un ambiente di sviluppo Node.js.
- Configura l'autenticazione
- Clona ed esegui il codice di esempio di GitHub.
Python
- Installa la libreria client Per ulteriori informazioni, consulta Configurare un ambiente di sviluppo Python.
- Configura l'autenticazione
- Clona ed esegui il codice di esempio di GitHub.
Visualizza l'output
Il codice restituisce il log del driver del job nel bucket di gestione temporanea predefinito di Managed Service per Apache Spark in Cloud Storage. Puoi visualizzare l'output del driver del job dalla Google Cloud console nella pagina Job di Managed Service per Apache Spark del tuo progetto nella Google Cloud console. Fai clic sull'ID job per visualizzare l'output del job nella pagina Dettagli job.