Google Distributed Cloud 网闸隔离配置 1.15.1 热修复

Hotfix 6

1.15.1-gdch.820-6 修补程序现已推出。此紧急修复程序修复了以下问题:

网络

  • 命名空间终止会阻止受管理的 Harbor 服务项目网络政策就绪,从而阻止新的 Harbor 实例。

  • 交换机型号配置不正确会导致管理聚合交换机运行不正常。

Hotfix 5

1.15.1-gdch.820-5 修补程序现已发布。此紧急修复程序修复了以下问题:

数据库服务

  • 无法更新或删除状态为 FailoverInProgress 的数据库集群。

监控

  • 托管 Harbor 服务监控目标需要很长时间才能加载。

修补程序 4

1.15.1-gdch.820-4 修补程序现已推出。此紧急修复程序修复了以下问题:

GDC 控制台

  • 针对 GDC 控制台提升了性能。

对象存储:

  • 解决了 50,000 个指标基数限制的问题,通过移除总数以外的事件来保持指标的正常流动。

  • 通过移除对 StorageGRID 和 KMS 的不必要调用,缩短了范围读取延迟时间。

Hotfix 3

1.15.1-gdch.820-3 修补程序现已推出。此紧急修复程序修复了以下问题:

Cloud DNS

  • 解决了与以下方面相关的 DNS 问题:受管理的 DNS 拆分、PKI 证书处理不正确以及无法删除旧版 Cloud DNS 记录。

  • 更新了 DNS SLO,使其依赖于组织基础架构和根管理员集群中的实际数据。

  • 增加了旧版 DNS 提醒的触发时间,以降低提醒频率。

  • DNS 指标存在 TLS 抓取问题。

  • 为全局 DNSRegistration 资源添加了 Istio 服务和 FRE 监听器。

  • 针对与基础架构运维者群组相关的 IAM 角色,解决了资源添加问题。

IAM

  • 增加了 AIS 的内存和副本,并添加了更精细的可操作参数,以便按容器调整它们。

  • 在 Grafana API 查询期间,发生了 302 错误重定向,导致可用性问题。

虚拟机

  • 在 kubelet 重启后,节点上的 GPU 资源无法重新填充,导致 GPU 虚拟机卡在 Scheduling 状态。

修补程序 2

1.15.1-gdch.820-2 修补程序现已推出。此紧急修复程序修复了以下问题:

集群

  • 使用操作系统版本注解时,集群内存在 NPC 放大问题。这适用于裸机节点和虚拟机节点。

数据库服务

  • 在更新高可用性 PostgreSQL 数据库的健康检查流程的相关规范时,存在冲突。

Google Distributed Cloud for Bare Metal

  • containerd 存在与 CVE-2025-31133、CVE-2025-52565 和 CVE-2025-52881 相关的安全问题。
  • 当集群正在协调时,繁忙的周边可能会触发删除操作,导致集群无响应。
  • 远程集群手表存在恢复问题。
  • 集群缓存客户端可能会在执行 GET 和 LIST 操作时变得无响应。
  • 在集群取消配置期间,节点删除会导致数据泄露。
  • 在 API 服务器实参中引用的配置映射和 Secret 出现竞态条件。

监控

  • 存在与公开调优堆栈的可操作参数相关的问题。

  • 存在与 Cortex 查询堆栈和缓存相关的次优 CPU 和内存限制。

  • 针对基数和标签数量添加了安全措施。

  • 添加了监控诊断信息中心。

  • 添加了其他监控 SLO。

  • AuditLogInventory 资源存在问题。

对象存储:

  • 缺少针对 BucketLocationConfig 权限问题的操作手册。

  • syslog-server 的默认副本值过低。

  • 添加了 S3 权限,用于提取各种存储桶元数据属性。

  • obj-system/allow-obs-system-ingress-traffic NetworkPolicy 资源添加了强制声明注解。

运维套件基础架构 (OI)

  • 为知识库同步添加了并发和重试逻辑。

操作系统

  • 在操作系统控制器重启期间,出现了意外的预检作业删除情况。

  • 无法正确处理过时的机器配置和 OSPolicy 资源删除。

  • 为操作系统政策控制器添加了指标、信息中心和事件。

  • OSPolicyReconciler 事件可能会随时间推移而降级。

  • 预检作业截止时间和重试次数无法配置,也不会持久存在。

  • 出现节点目标政策竞态条件,导致 API 负载降低。

  • OSPolicy 作业创建事件添加了原因。

  • 修改了用于操作系统监控和调试的预定义角色。

Resource Manager

  • 使用热补丁版本时无法创建组织。

工单系统

  • SECOps-P0024 运行手册中的防火墙签名更新步骤不准确。

升级

  • 使用热补丁版本时,无法完成基于政策的 Google Distributed Cloud for Bare Metal 升级。

Vertex AI

  • 启用了任意语言之间的翻译。以前,语言只能翻译成英语或德语。

虚拟机

  • 在删除虚拟机期间,不会移除虚拟机元数据服务器证书。

  • 克隆虚拟机磁盘时出现问题。

  • 在虚拟机映像导入期间添加了额外的验证,以检查导入过程是否成功。

  • 虚拟机外部访问权限显示了启用 Cloud NAT 的项目的出站 IP 地址。

修补程序 1

1.15.1-gdch.820-1 修补程序现已发布。此紧急修复程序修复了以下问题:

备份和恢复

  • 如果备份作业因 NetApp ONTAP 缓存问题而失败,则所有后续备份作业都会失败。

数据库服务

  • 高可用性 PostgreSQL 数据库集群的实例可能会被错误地删除。

  • 高可用性 PostgreSQL 数据库的规范更新会导致冲突。

身份和访问权限管理

  • 存在冲突的 IAM 和 DNS 角色名称。

Vertex AI

  • 长时间运行的 Vertex AI Translation 操作 API 返回 404 错误。

  • 部署在线预测模型时,缺少 Vertex AI Prediction Developer 角色。