排查报告故障主机 API 错误

本文档介绍了如何解决在使用报告故障主机 API 时可能遇到的错误。

错误消息

使用报告故障主机 API 时,您可能会遇到以下某个错误。

在运行操作期间删除了计算实例

当您在有故障的主机报告操作仍在进行中时删除计算实例,就会发生此错误。

错误消息

INTERNAL_ERROR

解决方法:在删除计算实例之前,请验证 reportHostAsFaulty 操作是否已完成。否则,报告主机故障操作将失败。

不属于预留的计算实例

如果您报告的计算实例是在未预留的情况下创建的,则会发生此错误。

错误消息

INSTANCES_WITHOUT_RESERVATION_NOT_SUPPORTED

解决方法:验证您是否使用受预留约束的预配模型创建了计算实例。如需报告使用灵活启动或 Spot 预配模型的 A4X Max、A4X、A4、A3 Ultra、A3 Mega 和 A3 High(8 个 GPU)实例的主机故障,请与您的客户支持团队联系。

重复的有故障的主机报告操作

当您向修复故障主机 API 发送请求时,如果同一计算实例的另一个请求已在进行中,则会发生此错误。此外,您的计算实例可能仍处于 REPAIRING 状态。

错误消息

FAILED_WITH_UNEXPECTED_STATUS

解决方法:等待第一个报告主机故障操作完成,然后再向 API 发送另一个请求。如果计算实例无响应,请先重启计算实例,然后再向 API 发送其他请求。

缺少故障原因

如果您未在报告故障主机请求中指定 faultReasons 字段,就会发生此错误。

错误消息

FAULT_REASONS_EMPTY_SHOULD_BE_SPECIFIED

解决方案faultReasons 字段为必填字段。如需解决此问题,请在请求中指定 faultReasons 字段

机器类型不正确

当计算实例使用不受支持的机器类型时,会发生此错误。

错误消息

MACHINE_TYPE_NOT_SUPPORTED

解决方案:报告故障主机 API 仅支持 A4X Max、A4X、A4、A3 Ultra、A3 Mega 和 A3 High(8 个 GPU)机器类型。

超出速率限制

错误消息

RATE_LIMIT_EXCEEDED

原因:您超出了 instances.reportHostAsFaulty 方法的请求限制,或者 Google 没有足够的容量来满足您的请求。

不支持的计算实例状态

当计算实例处于不受支持的状态时,会发生此错误。

错误消息

INSTANCE_SHOULD_BE_RUNNING

解决方案:在向“报告故障主机”API 发送请求之前,请验证计算实例是否处于 RUNNING 状态