このドキュメントでは、Gemini にプロンプトを入力してクラスタを計画および設計する方法について説明します。
Google Cloud コンソールの Gemini を AI を活用したインターフェースとして使用すると、ハードウェア オプションの評価、デプロイ費用の見積もり、クラスタの推奨構成の表示を行うことができます。推奨事項をカスタマイズするために、Gemini は割り当て上限、既存の予約、確約利用割引(CUD)、デフォルトのリージョンとゾーン、リソース ロケーションの制約を確認して、 Google Cloudプロジェクトを評価します。Gemini を使用して計画を立てることで、クラスタを作成または変更する前に、ワークロードに最適な構成を実現できます。
クラスタの作成前または作成時に構成する必要があるコンポーネントの詳細については、デプロイ オプションの概要をご覧ください。
制限事項
Google Cloud コンソールで Gemini にプロンプトを入力する場合、Gemini を使用してリソースの作成、変更、削除を行うことはできません。
始める前に
Google Cloud コンソールを使用して Google Cloud サービスと API にアクセスする場合、認証を設定する必要はありません。
必要なロール
Gemini にアクセスしてプロンプトを表示するために必要な権限を取得するには、プロジェクトに対する Cluster Director 閲覧者 (roles/hypercomputecluster.viewer)IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。
この事前定義ロールには、Gemini にアクセスしてプロンプトを表示するために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。
必要な権限
Gemini にアクセスしてプロンプトを表示するには、次の権限が必要です。
-
クラスタのリストを表示するには:
hypercomputecluster.clusters.list
カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。
Google Cloud コンソールで Gemini にアクセスする
Google Cloud コンソールで Gemini にアクセスする手順は次のとおりです。
Google Cloud コンソールで、[概要] ページに移動します。
Compute Advisor でインフラストラクチャを設計するセクションで、[新しいチャットを開始] をクリックします。
[Compute Advisor] ページで、次の情報を確認できます。
上のスクリーンショットに表示されている UI 要素は次のとおりです。
会話履歴のサイドパネル: 最近のチャットが表示されます。このパネルは次のように操作できます。
新しい会話を開始するには、[新しいチャット] をクリックします。
最近の会話を再開するには、[最近のチャット] セクションで会話をクリックします。
すべての会話の一覧を表示するには、[すべて表示] をクリックします。[履歴] ページでは、過去の会話の詳細を表示して再開したり、不要になった会話を削除したりできます。
クイック アクション プロンプト カード: それぞれにプロンプトのサンプルが含まれるカードのセット。カードをクリックすると、 Google Cloud コンソールによってプロンプト ボックスにサンプル プロンプトが自動的に入力されます。
プロンプト ボックス: このフィールドで、プロンプトを入力して送信できます。プロンプトを送信するには、[プロンプトを送信] をクリックします。
Gemini に指示を出す
プロンプトを送信すると、Gemini は回答の生成を開始します。ペインが表示され、次のスクリーンショットに示すように、 Google Cloud コンソールにプロンプトに対するレスポンスがペインに表示されます。
プロンプトに基づいて、レスポンス ペインには次の要素が含まれます。
コンテキスト グラウンディング: Gemini はプロジェクトのコンテキストを自動的に評価し、割り当て上限、既存の予約、CUD、デフォルトのリージョンとゾーン、リソースのロケーション制約など、高度にカスタマイズされた推奨事項を提供します。
インタラクティブなコード スニペット: Gemini は、gcloud コマンド、REST API メソッド、Terraform リソースを生成します。これらのコード スニペットをコピーして貼り付けるか、Cloud Shell で実行できます。
ビジュアル キャンバス: Gemini は、推奨事項を構造化されたテーブルと並列比較に整理します。このビューは、プロダクト機能とアーキテクチャ アプローチの評価に役立ちます。また、ユースケースの実装計画も提供します。
以降のセクションでは、プロンプトの作成に関するベスト プラクティスと、クラスタを作成または変更する前に使用できるプロンプトの例について説明します。
プロンプトのベスト プラクティス
Gemini から最も正確で実用的な推奨事項を得るには、コードブロックと同じ方法でプロンプトを構成することをおすすめします。このアプローチでは、明確なパラメータ宣言、役割定義、具体的な指示、明示的な出力形式を使用して、生成 AI をガイドします。
Gemini にプロンプトを入力する際は、次のベスト プラクティスを検討してください。
設計と計画に重点を置く: クラスタ エラーのトラブルシューティングについて Gemini にプロンプトを表示しないことをおすすめします。これらのエラーを解決するには、コンピューティング インスタンスの作成、更新、削除のトラブルシューティングをご覧ください。
ペルソナまたはロールを指定する: Gemini が採用するターゲット ロールまたはペルソナ(IT 管理者、AI 研究者、プラットフォーム エンジニアなど)を宣言します。このアプローチにより、推奨事項のトーン、深さ、専門知識のレベルが決まります。
明確な番号付きの指示を提供する: 目標を具体的な手順に沿った質問やタスクに分解します。このアプローチにより、Gemini の推論プロセスが構造化され、Gemini がすべての要件に対応できるようになります。
特定の出力形式を定義する: チュートリアル形式の説明、Markdown 形式の比較表、すぐに使用できる gcloud コードブロックなど、推奨事項の形式を明示的に指定します。
自動コンテキスト グラウンディングを活用する: デフォルトのリージョンまたはゾーン、使用可能な割り当て、CUD、リソースのロケーション制約をプロンプトに含める必要はありません。Gemini は、 Google Cloud プロジェクトでこの情報にアクセスできます。
デザインを繰り返し改善する: 新しいプロンプトを送信することで、Gemini が生成した回答を変更または拡張できます。たとえば、新しい会話を開始せずに、ネットワーキングの推奨事項をデプロイ プランに追加したり、ストレージ要件を変更したりできます。
プロンプトの例
クラスタの設計と最適化に役立つプロンプトの例を次に示します。
クラスタ トポロジとプレースメント戦略: 高パフォーマンスの AI ワークロードに最適なデプロイモデルと配置ポリシーを決定するには、次のようなプロンプトを使用します。
Act as an AI researcher. I need to design a cluster topology in Cluster Director for training a large language model that balances high accelerator performance with guaranteed capacity. Please provide the following: 1. A side-by-side comparison of deploying A3 Mega VMs across different regions. 2. An explanation of how topology-aware scheduling minimizes network latency. 3. The optimal reservation configuration for this training workload. Format the comparison as a Markdown table, and provide the deployment steps as a ready-to-use gcloud code block.プロビジョニング モデルと費用の最適化: プロビジョニング モデルを評価し、バッチ処理の費用を削減するには、次のようなプロンプトを使用します。
Act as an IT administrator. I need to find the cheapest way to run large, interruptible batch jobs on our clusters in Cluster Director without risking data loss. Please provide the following: 1. A cost and reliability comparison of standard discounted VMs against Spot VMs. 2. An explanation of how to provision all our compute power at the exact same time. 3. A deployment script that gives our jobs a two-minute warning before a Spot VM gets reclaimed. Format the comparison as a Markdown table, and provide the steps to take in the Google Cloud console.