Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini を使用してクラスタを設計、最適化する

このドキュメントでは、Gemini にプロンプトを入力してクラスタを計画および設計する方法について説明します。

Google Cloud コンソールの Gemini を AI を活用したインターフェースとして使用すると、ハードウェアオプションの評価、デプロイ費用の見積もり、クラスタの推奨構成の表示を行うことができます。推奨事項をカスタマイズするために、Gemini は割り当て上限、既存の予約、確約利用割引（CUD）、デフォルトのリージョンとゾーン、リソースロケーションの制約を確認して、 Google Cloudプロジェクトを評価します。Gemini を使用して計画を立てることで、クラスタを作成または変更する前に、ワークロードに最適な構成を実現できます。

クラスタの作成前または作成時に構成する必要があるコンポーネントの詳細については、デプロイオプションの概要をご覧ください。

制限事項

Google Cloud コンソールで Gemini にプロンプトを入力する場合、Gemini を使用してリソースの作成、変更、削除を行うことはできません。

始める前に

Google Cloud コンソールを使用して Google Cloud サービスと API にアクセスする場合、認証を設定する必要はありません。

必要なロール

Gemini にアクセスしてプロンプトを表示するために必要な権限を取得するには、プロジェクトに対する Cluster Director 閲覧者（roles/hypercomputecluster.viewer）IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

この事前定義ロールには、Gemini にアクセスしてプロンプトを表示するために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

Gemini にアクセスしてプロンプトを表示するには、次の権限が必要です。

クラスタのリストを表示するには: hypercomputecluster.clusters.list

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

Google Cloud コンソールで Gemini にアクセスする

Google Cloud コンソールで Gemini にアクセスする手順は次のとおりです。

Google Cloud コンソールで、[概要] ページに移動します。

概要を表示
Compute Advisor でインフラストラクチャを設計するセクションで、[新しいチャットを開始] をクリックします。
[Compute Advisor] ページで、次の情報を確認できます。

上のスクリーンショットに表示されている UI 要素は次のとおりです。
- 会話履歴のサイドパネル: 最近のチャットが表示されます。このパネルは次のように操作できます。
  - 新しい会話を開始するには、[新しいチャット] をクリックします。
  - 最近の会話を再開するには、[最近のチャット] セクションで会話をクリックします。
  - すべての会話の一覧を表示するには、[すべて表示] をクリックします。[履歴] ページでは、過去の会話の詳細を表示して再開したり、不要になった会話を削除したりできます。
- クイックアクションプロンプトカード: それぞれにプロンプトのサンプルが含まれるカードのセット。カードをクリックすると、 Google Cloud コンソールによってプロンプトボックスにサンプルプロンプトが自動的に入力されます。
- プロンプトボックス: このフィールドで、プロンプトを入力して送信できます。プロンプトを送信するには、[プロンプトを送信] をクリックします。

Gemini に指示を出す

プロンプトを送信すると、Gemini は回答の生成を開始します。ペインが表示され、次のスクリーンショットに示すように、 Google Cloud コンソールにプロンプトに対するレスポンスがペインに表示されます。

プロンプトを送信した後の Compute Advisor ページのスクリーンショット。

プロンプトに基づいて、レスポンスペインには次の要素が含まれます。

コンテキストグラウンディング: Gemini はプロジェクトのコンテキストを自動的に評価し、割り当て上限、既存の予約、CUD、デフォルトのリージョンとゾーン、リソースのロケーション制約など、高度にカスタマイズされた推奨事項を提供します。
インタラクティブなコードスニペット: Gemini は、gcloud コマンド、REST API メソッド、Terraform リソースを生成します。これらのコードスニペットをコピーして貼り付けるか、Cloud Shell で実行できます。
ビジュアルキャンバス: Gemini は、推奨事項を構造化されたテーブルと並列比較に整理します。このビューは、プロダクト機能とアーキテクチャアプローチの評価に役立ちます。また、ユースケースの実装計画も提供します。

以降のセクションでは、プロンプトの作成に関するベストプラクティスと、クラスタを作成または変更する前に使用できるプロンプトの例について説明します。

プロンプトのベストプラクティス

Gemini から最も正確で実用的な推奨事項を得るには、コードブロックと同じ方法でプロンプトを構成することをおすすめします。このアプローチでは、明確なパラメータ宣言、役割定義、具体的な指示、明示的な出力形式を使用して、生成 AI をガイドします。

Gemini にプロンプトを入力する際は、次のベストプラクティスを検討してください。

設計と計画に重点を置く: クラスタエラーのトラブルシューティングについて Gemini にプロンプトを表示しないことをおすすめします。これらのエラーを解決するには、コンピューティングインスタンスの作成、更新、削除のトラブルシューティングをご覧ください。
ペルソナまたはロールを指定する: Gemini が採用するターゲットロールまたはペルソナ（IT 管理者、AI 研究者、プラットフォームエンジニアなど）を宣言します。このアプローチにより、推奨事項のトーン、深さ、専門知識のレベルが決まります。
明確な番号付きの指示を提供する: 目標を具体的な手順に沿った質問やタスクに分解します。このアプローチにより、Gemini の推論プロセスが構造化され、Gemini がすべての要件に対応できるようになります。
特定の出力形式を定義する: チュートリアル形式の説明、Markdown 形式の比較表、すぐに使用できる gcloud コードブロックなど、推奨事項の形式を明示的に指定します。
自動コンテキストグラウンディングを活用する: デフォルトのリージョンまたはゾーン、使用可能な割り当て、CUD、リソースのロケーション制約をプロンプトに含める必要はありません。Gemini は、 Google Cloud プロジェクトでこの情報にアクセスできます。
デザインを繰り返し改善する: 新しいプロンプトを送信することで、Gemini が生成した回答を変更または拡張できます。たとえば、新しい会話を開始せずに、ネットワーキングの推奨事項をデプロイプランに追加したり、ストレージ要件を変更したりできます。

プロンプトの例

クラスタの設計と最適化に役立つプロンプトの例を次に示します。

クラスタトポロジとプレースメント戦略: 高パフォーマンスの AI ワークロードに最適なデプロイモデルと配置ポリシーを決定するには、次のようなプロンプトを使用します。

Act as an AI researcher. I need to design a cluster topology in
Cluster Director for training a large language model that balances high
accelerator performance with guaranteed capacity.

Please provide the following:
1. A side-by-side comparison of deploying A3 Mega VMs across different
   regions.
2. An explanation of how topology-aware scheduling minimizes network
   latency.
3. The optimal reservation configuration for this training workload.

Format the comparison as a Markdown table, and provide the deployment steps
as a ready-to-use gcloud code block.

プロビジョニングモデルと費用の最適化: プロビジョニングモデルを評価し、バッチ処理の費用を削減するには、次のようなプロンプトを使用します。

Act as an IT administrator. I need to find the cheapest way to run large,
interruptible batch jobs on our clusters in Cluster Director
without risking data loss.

Please provide the following:
1. A cost and reliability comparison of standard discounted VMs against
   Spot VMs.
2. An explanation of how to provision all our compute power at the exact
   same time.
3. A deployment script that gives our jobs a two-minute warning before a
   Spot VM gets reclaimed.

Format the comparison as a Markdown table, and provide the steps to take in
the Google Cloud console.