GDC コネクテッドの Gemini API の仕組み

このページでは、Gemini on Google Distributed Cloud コネクテッド API の仕組みについて説明します。インフラストラクチャ、ハードウェア、ソフトウェアの機能に関する情報も含まれています。

概要

Gemini on GDC connected API は、ローカル ネットワークに接続された Google 認定ハードウェアに Gemini モデルをデプロイできるターンキー ソフトウェア ソリューションです。モデルは、 Distributed Cloud 接続クラスタにデプロイされた Confidential Virtual Machines(CVM)内でホストされます。 必要なハードウェアには、Google によって確立および認定された特定の構成があります。

Google 認定ハードウェア

Gemini on GDC connected API には、 Google 認定ハードウェアに記載されているとおりに構成された Google 認定ハードウェアが必要です。 Gemini on GDC connected API を注文する前に、このハードウェアを注文して設置する必要があります。 Gemini on GDC connected API を注文する際は、インストール要するに、対応するサービスタグとその他のハードウェア識別情報を Google に提供する必要があります。

Google 認定ハードウェアの仕様は次のとおりです。

  • プラットフォーム: Dell XE9680 サーバー シャーシ
  • CPU: Intel Xeon Platinum 8592+ 64 コア プロセッサ x 2
  • メモリ: 2 TB DDR5 5600 MT/秒 RDIMM RAM
  • GPU: NVIDIA HGX H200 SXM アセンブリ(NVIDIA H200 シリーズ GPU x 8)
  • ストレージ: FIPS 認定 NVMe ストレージ(次のように構成)
    • オペレーティング システム用のハードウェア RAID1 の 960 GB ドライブ x 2
    • システム予約機能用に予約されたソフトウェア RAID1 の 15.36 TB ドライブ x 2
    • Gemini on GDC に接続された API エンドポイントをローカルで提供する Confidential Virtual Machines のデータを保存するための 15.36 TB ドライブ x 6
  • ネットワーク:
    • Mellanox ConnectX-6 デュアルポート 100 GbE QFSP56 ネットワーク アダプタ x 2
    • Broadcom 5720 1 GbE ネットワーク アダプタ x 1(統合)
  • 管理: 組み込みシステム管理用の Integrated Dell Remote Access Controller 9(iDRAC9)Datacenter 16G
  • 電源: 2800 W チタン認定電源 x 6

Gemini on GDC connected API の単一デプロイは、Google 認定マシン 1 台で構成されます。 Gemini on GDC connected API は、Google 認定以外のハードウェア構成では実行されません

Confidential Virtual Machines

Gemini on GDC connected API によって提供されるモデルは、 Distributed Cloud connected クラスタで実行される Confidential Virtual Machines 内でホストされます。 リモート認証により、デプロイされた CVM と、それらを実行する安全なソフトウェア環境のセキュリティと整合性が確保されます。

リモート認証

Gemini on GDC connected API では、デプロイされた CVM と、それらをホストする安全なソフトウェア環境のリモート認証を維持するために、常にインターネット接続が必要です。認証メカニズムは、 Intel® Software Guard Extension(Intel® SGX)Remote Attestation Services を使用して実装されます。Gemini on GDC connected API を注文する際は、Intel® SGX Provisioning Certification Service のサブスクリプションを取得し、対応する API キーを Google に提供する必要があります。

リモート認証の失敗

リモート認証サービスは、Gemini on GDC connected API デプロイと Google の間にハートビートを確立します。これには、中断のないインターネット接続が必要です。このハートビートが 30 分以上連続して中断されると、ハートビートが再確立されるまで CVM がシャットダウンされます。認証エラーを解決するには、Google 担当者にお問い合わせください。

サポートされているモデル

このリリースの Gemini on GDC connected API は、次のモデルをサポートしています。

  • Gemini 2.5 Flash 128k と公開 ID gemini-2.5-flash およびプロンプト ID gemini-2.5-flash-ggc

プロンプト リクエストを作成するためにエンドポイントとやり取りする場合を除き、すべてのコマンドでモデルの公開 ID を使用します。 プロンプト リクエストを作成してエンドポイントに送信する場合は、プロンプト ID を使用します。

デプロイ手順を実行する

大まかに言うと、Gemini on GDC connected API での Gemini モデルのデプロイは次のようになります。

  1. ハードウェアの説明に従って、Google 認定ハードウェアを調達して設置します。
  2. インストール要件に記載されているすべてのインストール要件を満たすために必要な手順を完了します。
  3. Distributed Cloud connected で Gemini on Google Distributed Cloud connected API on Distributed Cloud connected の説明に従って、Gemini on GDC connected API を注文します。注文する際は、インストール要件に記載されている情報を提供する必要があります。これにより、Google は、デプロイするモデルをホストする CVM のソフトウェア管理とリモート認証のために、Gemini on GDC connected API デプロイをプロビジョニングできます。
  4. Google 認定ハードウェアに Gemini on GDC connected API ソフトウェアをインストールして構成するために、お客様の拠点に訪問する必要がある Google の技術者との訪問日をスケジュールします。
  5. 必要な API を有効にするの説明に従って、必要な API を有効にします
  6. 新しいセルフサービスの Cloud 請求先アカウントを作成するの説明に従って、ターゲット Google Cloud プロジェクトの Cloud 請求先アカウントを設定します。
  7. 必要なロールを付与するの説明に従って、Google Distributed Cloud コネクテッド 上の Gemini API 管理者と GDC コネクテッド 上の Gemini API モデル コンシューマ アカウントに必要なロールを付与します。
  8. Gemini on GDC connected API エンドポイントを デプロイするの説明に従って、Gemini on GDC connected API エンドポイントを作成してデプロイします。
  9. Gemini on GDC connected API エンドポイントとやり取りするの説明に従って、デプロイされた Gemini on GDC connected API エンドポイントとやり取りします。

次のステップ