本页介绍了 Google Distributed Cloud Connected API 上的 Gemini 的运作方式,包括有关其基础架构、硬件和软件功能的信息。
概览
Gemini on GDC connected API 是一种开箱即用的软件解决方案,可让您在连接到本地网络的 Google 认证硬件上部署 Gemini 模型。这些模型托管在部署于分布式云连接集群上的保密虚拟机 (CVM) 中。所需硬件具有 Google 建立并认证的特定配置。
经 Google 认证的硬件
Gemini on GDC Connected API 需要经过 Google 认证的硬件,并且配置必须完全符合经过 Google 认证的硬件中的说明。 您必须先在本地订购并安装此硬件,然后才能订购 Gemini on GDC connected API。 订购 Gemini on GDC connected API 时,您必须按照安装要求中所述,向 Google 提供相应的服务标签和其他硬件识别信息。
经过 Google 认证的硬件具有以下规范:
- 平台:Dell XE9680 服务器机箱
- CPU:2 个 Intel Xeon Platinum 8592+ 64 核处理器
- 内存:2TB DDR5 5600 MT/s RDIMM RAM
- GPU:NVIDIA HGX H200 SXM 组件,包含八 (8) 个 NVIDIA H200 系列 GPU
- 存储:经过 FIPS 认证的 NVMe 存储,配置如下:
- 2 个 960 GB 驱动器,采用硬件 RAID1,用于操作系统
- 软件 RAID1 中的 2 个 15.36 TB 硬盘,预留给系统预留功能
- 6 个 15.36 TB 驱动器,用于存储机密虚拟机的本地数据,这些虚拟机可为连接到 GDC 的 Gemini API 端点提供服务。
- 网络:
- 两 (2) 个 Mellanox ConnectX-6 双端口 100 GbE QFSP56 网络适配器
- 一个 (1) 集成的 Broadcom 5720 1 GbE 网卡
- 管理:集成式 Dell 远程访问控制器 9 (iDRAC9) 数据中心 16G,用于嵌入式系统管理
- 电源:六 (6) 个 2800W 钛金认证电源
Gemini on GDC connected API 的单个部署包含一台 (1) 经过 Google 认证的机器。Gemini on GDC connected API 不在非 Google 认证的硬件配置上运行。
保密虚拟机
由 Gemini on GDC connected API 提供的模型托管在运行于分布式云连接集群中的保密虚拟机内。远程证明可确保已部署 CVM 的安全性、完整性以及运行这些 CVM 的安全软件环境的安全性。
远程证明
Gemini on GDC connected API 需要持续的互联网连接,以保持对已部署 CVM 和托管它们的安全软件环境的远程证明。证明机制使用 Intel® Software Guard Extension (Intel® SGX) 远程证明服务来实现。您必须订阅 Intel® SGX Provisioning Certification Service,并在订购通过 GDC 连接的 API 上的 Gemini 时向 Google 提供相应的 API 密钥。
远程证明失败
远程证明服务会在连接到 API 的 Gemini on GDC 部署与 Google 之间建立心跳,这需要不间断的互联网连接。如果此心跳中断的时间连续超过 30 分钟,CVM 将关闭,直到重新建立心跳为止。请与您的 Google 代表联系,以解决认证失败问题。
支持的模型
此版本的 Gemini on GDC connected API 支持以下模型:
- Gemini 2.5 Flash 128k,公开 ID 为
gemini-2.5-flash-gcc。
部署步骤
概括来讲,在 Gemini on GDC connected API 上部署 Gemini 模型的过程如下所示:
- 按照硬件中的说明,采购并安装经过 Google 认证的硬件。
- 完成满足安装要求中所述所有安装要求所需的步骤。
- 按照在 Distributed Cloud connected 上订购 Gemini on Google Distributed Cloud connected API 中的说明订购 Gemini on GDC connected API。 在订购时,您必须提供安装要求中列出的信息,以便 Google 可以为您的 Gemini on GDC 连接的 API 部署提供软件管理和远程证明,以证明托管您要部署的模型的 CVM。
- 安排 Google 技术人员上门,以便在您的 Google 认证硬件上安装和配置 Gemini on GDC Connected API 软件。
- 按照启用所需的 API 中的说明启用所需的 API。
- 按照创建新的自助 Cloud Billing 账号中所述,为目标 Google Cloud 项目设置 Cloud Billing 账号。
- 按照授予必需的角色中所述,为 Gemini on Google Distributed Cloud Connected API 管理员和 Gemini on GDC Connected API 模型消费者账号授予必需的角色。
- 按照部署 Gemini on GDC Connected API 端点中所述,创建并部署 Gemini on GDC Connected API 端点。
- 按照与 Gemini on GDC 连接的 API 端点互动中的说明,与已部署的 Gemini on GDC 连接的 API 端点互动。