クライアント ライブラリを使用してクラスタを作成する
下に記載のサンプルコードは、Cloud クライアント ライブラリを使用して Managed Service for Apache Spark クラスタを作成し、そのクラスタでジョブを実行した後、そのクラスタを削除する方法を示しています。
以下を使用してこうしたタスクを実行することもできます。
- API Explorer を使用したクイックスタートの API REST リクエスト
- Google Cloud コンソールを使用してクラスタを作成するの Google Cloud コンソール
- Google Cloud CLI を使用してクラスタを作成するの Google Cloud CLI
始める前に
- Google Cloud アカウントにログインします。 Google Cloudを初めて使用する場合は、 アカウントを作成して、実際のシナリオでの Google プロダクトのパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Dataproc API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Dataproc API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
コードを実行する
チュートリアルを試す: [Cloud Shell で開く] をクリックして、Python Cloud クライアント ライブラリのチュートリアルを実行します。このチュートリアルでは、クラスタを作成し、PySpark ジョブを実行した後、クラスタを削除します。
Go
- クライアント ライブラリをインストールします。詳しくは、開発環境をセットアップするをご覧ください。
- 認証を設定します。
- サンプル GitHub コードのクローンを作成して実行します。
Java
- クライアント ライブラリをインストールします。詳細については、Java 開発環境の設定をご覧ください。
- 認証を設定します。
- サンプル GitHub コードのクローンを作成して実行します。
Node.js
- クライアント ライブラリをインストールします。詳細については、Node.js 開発環境の設定をご覧ください。
- 認証を設定します。
- サンプル GitHub コードのクローンを作成して実行します。
Python
- クライアント ライブラリをインストールします。詳細については、Python 開発環境の設定をご覧ください。
- 認証を設定します。
- サンプル GitHub コードのクローンを作成して実行します。
出力を表示する
このコードでは、Cloud Storage のデフォルトの Managed Service for Apache Spark ステージング バケットにジョブドライバのログが出力されます。プロジェクトの Managed Service for Apache Spark の [ジョブ] ページで、 Google Cloud コンソールからジョブドライバ出力を表示できます。ジョブ ID をクリックすると、[ジョブの詳細] ページにジョブ出力が表示されます。 Google Cloud
次のステップ
- Managed Service for Apache Spark Cloud クライアント ライブラリの追加リソースをご覧ください。