安装要求

在订购 Google Distributed Cloud 硬件之前,您必须满足本页面中所述的 Distributed Cloud 安装要求。

规划硬件配置

在订购硬件之前,您的网络管理员必须与 Google 合作,为 Distributed Cloud 安装规划硬件配置。

根据您的业务需求,网络管理员必须确定并提供以下信息:

  • 每个变体的机架数量
  • 电源类型(交流或直流)

Distributed Cloud 以以下变体之一的形式提供。

Configuration 1 配置 2
配置 6 台非 GPU 服务器,配有本地固态硬盘存储、2 台 ToR 交换机、专用机架 6 台支持 GPU 的服务器,配有本地固态硬盘存储、2 台 ToR 交换机、专用机架
用途 非常适合通用计算 非常适合 AI/ML 或图形密集型工作负载
估算的费用 价格 价格
CPU 6 个 96 vCPU(总共 576 个 vCPU) 6 个 96 vCPU(总共 576 个 vCPU)
GPU 6 个双 NVIDIA Tesla T4 GPU(总共 12 个 GPU)
RAM 6 x 256 GB(总计 1536 GB) 6 x 256 GB(总计 1536 GB)
存储 6 块 4 TB SSD(总共 24 TB) 6 块 4 TB SSD(总共 24 TB)
功率 交流或直流 仅限 AC

购买高级支持服务

Distributed Cloud 需要高级支持。 如果您目前不是高级支持客户,则必须购买高级支持才能使用 Distributed Cloud。

提供 Google Cloud 信息

订购硬件时,您必须向 Google 提供以下信息(如适用):

  • 您的 Google Cloud 组织 ID
  • 您希望 Google 在现有 Google Cloud 项目还是新Google Cloud 项目中预配 Distributed Cloud 机器
  • 目标 Google Cloud 项目的 ID(如果您要将资源预配为现有 Google Cloud 项目的一部分)
  • 所需的分布式云区域数量

交付路径和安装地点

为验证您的配送路线和安装地点是否能容纳 Distributed Cloud 硬件,Google 可能会要求您提供准确描绘这两者的照片和图纸,或者对您的地点进行交付前调查。

配送路线必须畅通无阻,坡度低于 3%。 如果安装地点不在装卸平台或建筑物入口所在的楼层,您必须提供电梯使用权限。

所有门道、走廊和电梯都必须支持装箱的分布式云硬件的总重量和尺寸。

您必须在整个交付过程中(直至安装地点)为 Google 服务技术人员提供访问权限。

如果您的安装地点不是典型的数据中心,您必须在订购硬件之前提供安装地点的尺寸图,以确保机架能够安全地安装并启动。

所需空间

Distributed Cloud 硬件机架装在以下尺寸的箱子中。

维度 值(英制) 价值(指标)
高度 87 英寸 221 厘米
深度 60 英寸 152 厘米
宽度 40 英寸 102 厘米

Distributed Cloud 硬件机架的尺寸如下。

维度 值(英制) 价值(指标)
高度 80 英寸 203 厘米
深度 48 英寸 122 厘米
宽度 24 英寸 61 厘米

如果您的当地管辖区或设施要求您加固分布式云机架,您可能需要特殊的抗震加固硬件。Distributed Cloud 机架在出厂时通过支架固定在包装箱中,您可以重复使用这些支架将机架固定到地面。不过,这些支架可能不符合您当地的支架要求。

机架重量

分布式云机架的总重量如下。

机架填充 总重量
一般 900 磅(408 千克)
上限 1300 磅(590 千克)

运送路线(包括任何电梯)和安装地点必须能够安全地承受此重量,同时完全符合当地建筑规范。

电源

Distributed Cloud 机架需要 50Hz 或 60Hz 的单相或三相交流电,或者 -48V 直流电电信风格的正极接地电源。订购硬件时,您必须指定所需的电源类型。

您必须按照当地建筑规范为安装地点供电,包括以下工作:

  • 安装线缆管道
  • 敷设所需的线缆
  • 将线缆连接到配电盘
  • 开启电源

所有电气工作都必须由经过认证的电工执行。

线路规格

您必须提供以下数量的独立电源线,以确保高可用性,具体取决于您要部署的变体。

变体 线路要求
交流电源 两条 (2) 独立电源线,带有专用接地连接
直流电源 四 (4) 条独立供电线路,具有专用回流线路和专用接地连接

所有电源插座必须位于安装位置 6 英尺(1.8 米)以内。

交流电源规格

对于交流电源,所有电源线都必须满足以下一项规格。

阶段 电压 电流 连接器
单相 208V,50/60Hz 30A NEMA L6-30P
单相 230V,50/60Hz 32A IEC 60309 2P+2E 6Hr
三相星形 120V/208V,50/60Hz 30A NEMA L21-30P
三相 Delta 208V,50/60Hz 60A IEC 60309 3P+G 9Hr
三相 Delta 208V,50/60Hz 50A CS8365 50A 3P+G
三相星形 240V/410V,50/60Hz 16A IEC 60309 3P+N+PE 6Hr
三相星形 230V/400V,50/60Hz 32A IEC 60309 3P+N+PE 6Hr

直流电源规格

对于直流电源,所有电源线都必须是正极接地 -48V 电信风格的线路,且采用以下配置:

  • 4 条电源线,由两个或更多冗余直流电源供电
  • 4 条回流线路,分别连接到对应的冗余直流电源
  • 1 个专用接地线

这些线条必须符合以下规范。

线型 电压 电流 连接器
供应 -44V 至 -60V 125A 双孔 3/8 英寸(孔间距为 1 英寸)压接线耳
返回 -44V 至 -60V 125A 双孔 3/8 英寸(孔间距为 1 英寸)压接线耳
地面 不适用 咨询电工 单孔 1/4 英寸压接线耳

功耗

分布式云硬件机架的功耗介于 3,000W 和 5,500W 之间,具体取决于所选配置、GPU 的存在情况、CPU 负载和其他因素。启动时的峰值功耗可暂时达到 5,900 瓦。

备用电源

对于任一变体,每个独立电源线都必须配备独立的不间断电源 (UPS),该电源能够为分布式云硬件持续供电,对于电池系统至少 20 分钟,对于惯性系统至少 15 秒。

除了 UPS 备份之外,您还必须提供容量充足的应急发电机备份,以便为 UPS 设备充电并为分布式云硬件供电,至少持续 4 小时。Distributed Cloud 硬件必须连接到 UPS 设备。然后,UPS 装置必须使用自动转换开关 (ATS) 或类似的系统连接到发电机备用电源,以便在紧急情况下自动转换电源,无需人工干预。

没有发电机备用电源的电池 UPS 系统(例如旧版 DC 设备)必须具有足够的容量,才能为分布式云供电至少 4 小时。

制冷

Distributed Cloud 硬件机架采用空气冷却,需要受气候控制的环境才能运行。安装地点必须提供足够的冷却,以确保 Distributed Cloud 硬件正常运行。

安装地点必须提供以下环境条件。

环境因素 所需范围
温度 介于 59°F (15°C) 和 89°F (31°C) 之间
相对湿度 30% 到 70%,无结露

环境温度和相对湿度波动不得超过以下值:

  • 环境温度:每小时 +/- 9°F (5°C)
  • 相对湿度:每小时 +/- 5%

这些指南适用于海拔高度低于 10,000 英尺(3050 米)MSL 的安装。对于海拔较高的地区,请咨询 HVAC 专业人员和您的 Google 代表。 如果出现超出这些建议范围的极端波动,可能会导致保护性关机和/或分布式云硬件永久损坏。

该机架每小时最多产生 13,650 BTU 的热量,并使用强制空气来散发已安装硬件产生的热量。机架正面用作冷空气进气口,机架背面用作热空气排气口。您必须在机架的前后两端留出 4 英尺(1.2 米)的开放空间,以确保气流充足。如果可能,请将机架安装在专用穿孔地砖或通风口的前面。

Distributed Cloud 要求部署地点的空气通过永久安装的商用或工业级 HVAC 设备持续循环、调节和过滤。如果未能保持所需的环境条件,可能会对 Distributed Cloud 硬件造成长期损坏,并降低 Distributed Cloud 部署的可靠性。

冷却基础设施必须符合以下准则:

  • 所有 HVAC 设备都必须配备备用电源,并且能够在断电后自动重启。
  • 空气处理机组、空调设备、冷凝器、泵、冷却塔、冷水机组和其他 HVAC 组件必须具有适当的冗余。
  • 您必须定期检查和维护 HVAC 设备,以确保其运行性能始终如一,并保持在所需范围内。
  • 不得将分布式云硬件暴露在直射阳光或任何其他类型的红外辐射下,因为这会改变硬件的已验证温度曲线。
  • 不得将 Distributed Cloud 硬件暴露在未经调节和过滤的空气中。即使是短暂的暴露也可能会导致灰尘堆积,从而限制关键组件的气流。
  • 如果新风冷却系统经过专业设计和安装,则可以接受。不过,它必须满足之前列出的散热要求。

网络

Distributed Cloud 硬件机架需要四个 LC 单模光纤连接,这些连接在本地网络上的两个冗余网络设备之间拆分。仅支持 100GBASE-LR4 和 10GBASE-LR 链路。订购 Distributed Cloud 硬件时,您必须指定网络要求,例如 IP 地址范围和防火墙配置。对于光传输电路,请启用故障传播,以实现最佳路由协议收敛。

在订购之前,您的网络管理员必须与 Google 合作,规划 Distributed Cloud 安装的网络配置。

图 1 描绘了典型的分布式云配置:

图 1. 分布式云组件。
图 1. 分布式云组件。

如需详细了解此图表中显示的组件,请参阅 Distributed Cloud 硬件

分配地址块

Distributed Cloud 要求您在本地网络上分配以下地址块。

网络组件 分配要求
与本地网络的对等互连链接

四个公共或专用 /31 CIDR 地址块。

您可以提供四个 /31 CIDR 地址块、一个 VLAN ID 和两个涵盖这四个地址块的 BGP ASN。一个 ASN 用于与分布式云 ToR 交换机对等互连的本地路由器,另一个 ASN 用于分布式云交换机。

ToR 交换机管理子网 至少一个 /30 CIDR 块,可以是公共 CIDR 块,也可以是 RFC 1918 CIDR 块。
分布式云机器管理子网 至少一个 /27 CIDR 地址块,可以是公共地址块,也可以是 RFC 1918 地址块。
分布式云节点子网 至少一个 /27 CIDR 地址块,可以是公共地址块,也可以是 RFC 1918 地址块。

订购 Distributed Cloud 硬件时,您的网络管理员必须提供上述 CIDR 地址块分配信息。分布式云部署完毕后,这些值将无法更改。

节点、机器管理和 ToR 交换机 CIDR 块必须是本地网络上的可路由子网。它们可以是专用 RFC 1918 范围子网,也可以是公共网络。您必须在对等互连边缘路由器上配置适当的 BGP 会话,以接受分布式云节点子网、分布式云机器管理子网和 ToR 交换机管理子网的较低两个 /32 IP 地址的路由。

CIDR 地址块是按 Distributed Cloud 机架分配的。 创建 Distributed Cloud 集群时,Distributed Cloud 会根据节点的功能和可用性,自动将该集群中的节点分配给指定节点 CIDR 地址块中的 IP 地址。

在多机架 Distributed Cloud 安装中,您必须为每个 Distributed Cloud 机架指定唯一的 CIDR 地址段。每个机架都单独连接到您的网络。

如果您计划使用其他机器扩展 Distributed Cloud 安装,则必须在初始 Distributed Cloud 订单中考虑这需要额外的 IP 地址。您还必须考虑开销 IP 地址,例如工作负载与Google Cloud之间的 VPN 连接所使用的网关地址和浮动地址。与您的 Google Cloud 销售代表合作,根据您的业务需求确定最佳节点 CIDR 地址块分配。

当 Distributed Cloud 安装正常运行后,您还需要为 Distributed Cloud Pod 和 Service 分配网络 IP 地址,如 Distributed Cloud Pod 和 Service 网络地址分配中所述。

配置防火墙

Distributed Cloud 要求您配置防火墙以允许以下类型的网络流量:

  • Distributed Cloud 管理和集群控制平面流量
  • 分布式云工作负载流量

分布式云管理和集群控制平面流量

Distributed Cloud 要求您在本地网络上打开以下端口。Distributed Cloud 需要这些端口才能通过互联网建立与 Google 的出站连接,以用于管理和集群控制平面流量。您必须使用跟踪此出站流量的有状态防火墙,并允许相应的返回入站流量通过该防火墙到达分布式云。

函数 原始子网 协议 端口
域名系统 (DNS) ToR 交换机管理、分布式云机器管理、分布式云节点 TCP、UDP 53
网络时间协议 (NTP) ToR 交换机管理、分布式云机器管理、分布式云节点 UDP 123
用于交换机身份验证的终端访问控制器访问控制系统 (TACACS) ToR 交换机管理 TCP 3535
管理 VPN ToR 交换机管理、分布式云机器管理 UDP 443
引导和管理 API ToR 交换机管理、分布式云机器管理 TCP 443
远程 Kubernetes 控制平面 分布式云机器管理、分布式云节点 TCP 6443
Kubernetes Konnectivity 代理 分布式云机器管理、分布式云节点 TCP 8132、8133、8134
监控服务 分布式云机器管理、分布式云节点 TCP 443
日志记录服务 分布式云机器管理、分布式云节点 TCP 443
Cloud VPN 和虚拟私有云数据平面 分布式云节点 UDP (ESP、IKE) 500、4500

分布式云工作负载流量

您的网络管理员还必须配置额外的防火墙规则,以允许流量进出部署在 Distributed Cloud 集群上的工作负载。

如果您在 NAT 网关后部署分布式云,并且在 WAN 网关上配置了其他防火墙规则来过滤或阻止入站 UDP 流量,则分布式云所需的 Cloud VPN 连接可能会受到影响。在这种情况下,您必须允许来自 Cloud VPN IP 地址范围的入站 Cloud VPN UDP 流量。

例如,您需要允许来自源 IP 地址范围 35.242.0.0/1735.220.0.0/1734.157.0.0/16 的入站 UDP 流量,且源端口与 5004500 (IKE/ESP) 相匹配。如果您的防火墙解决方案需要更精确的配置,请将目标 IP 地址范围设置为与分布式云节点子网的 IP 地址范围相匹配。如果防火墙位于 NAT 网关的上游,请将目标 IP 地址范围设置为 NAT 网关的公共 IP 地址。

现场维护

Google 会远程监控 Distributed Cloud 硬件。如果您遇到问题,请与支持团队联系以提交工单。如果 Google 检测到硬件故障,我们会安排前往您的安装地点。Google 认证的技术人员会与您一起协调上门事宜,并进行必要的维修。

后续步骤