本文档介绍了如何解决在使用报告故障主机 API 时可能遇到的错误。
错误消息
使用报告故障主机 API 时,您可能会遇到以下某个错误。
在运行操作期间删除了计算实例
当您在有故障的主机报告操作仍在进行中时删除计算实例,就会发生此错误。
错误消息:
INTERNAL_ERROR
解决方法:在删除计算实例之前,请验证 reportHostAsFaulty 操作是否已完成。否则,报告主机故障操作将失败。
不属于预留的计算实例
如果您报告的计算实例是在未预留的情况下创建的,则会发生此错误。
错误消息:
INSTANCES_WITHOUT_RESERVATION_NOT_SUPPORTED
解决方法:验证您是否使用受预留约束的预配模型创建了计算实例。如需报告使用灵活启动或 Spot 预配模型的 A4X Max、A4X、A4、A3 Ultra、A3 Mega 和 A3 High(8 个 GPU)实例的主机故障,请与您的客户支持团队联系。
重复的有故障的主机报告操作
当您向修复故障主机 API 发送请求时,如果同一计算实例的另一个请求已在进行中,则会发生此错误。此外,您的计算实例可能仍处于 REPAIRING 状态。
错误消息:
FAILED_WITH_UNEXPECTED_STATUS
解决方法:等待第一个报告主机故障操作完成,然后再向 API 发送另一个请求。如果计算实例无响应,请先重启计算实例,然后再向 API 发送其他请求。
缺少故障原因
如果您未在报告故障主机请求中指定 faultReasons 字段,就会发生此错误。
错误消息:
FAULT_REASONS_EMPTY_SHOULD_BE_SPECIFIED
解决方案:faultReasons 字段为必填字段。如需解决此问题,请在请求中指定 faultReasons 字段。
机器类型不正确
当计算实例使用不受支持的机器类型时,会发生此错误。
错误消息:
MACHINE_TYPE_NOT_SUPPORTED
解决方案:报告故障主机 API 仅支持 A4X Max、A4X、A4、A3 Ultra、A3 Mega 和 A3 High(8 个 GPU)机器类型。
超出速率限制
错误消息:
RATE_LIMIT_EXCEEDED
原因:您超出了 instances.reportHostAsFaulty 方法的请求限制,或者 Google 没有足够的容量来满足您的请求。
不支持的计算实例状态
当计算实例处于不受支持的状态时,会发生此错误。
错误消息:
INSTANCE_SHOULD_BE_RUNNING
解决方案:在向“报告故障主机”API 发送请求之前,请验证计算实例是否处于 RUNNING 状态。