report faulty host API エラーのトラブルシューティング

このドキュメントでは、障害のあるホスト API の報告の使用時に発生する可能性のあるエラーの解決方法について説明します。

エラー メッセージ

障害のあるホストの報告 API を使用すると、次のいずれかのエラーが発生することがあります。

実行中のオペレーション中に Compute インスタンスが削除された

このエラーは、障害のあるホストのレポート オペレーションが進行中にコンピューティング インスタンスを削除すると発生します。

エラー メッセージ:

INTERNAL_ERROR

解決策: コンピューティング インスタンスを削除する前に、reportHostAsFaulty オペレーションが完了していることを確認します。それ以外の場合、障害のあるホストを報告するオペレーションは失敗します。

コンピューティング インスタンスが予約の一部ではない

このエラーは、予約を使用せずに作成されたコンピューティング インスタンスを報告した場合に発生します。

エラー メッセージ:

INSTANCES_WITHOUT_RESERVATION_NOT_SUPPORTED

解決策: 予約にバインドされたプロビジョニング モデルを使用してコンピューティング インスタンスを作成したことを確認します。フレキシブル スタートまたはスポット プロビジョニング モデルを使用する A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(GPU 数 8)インスタンスの障害のあるホストを報告するには、アカウント チームにお問い合わせください。

障害のあるホストの報告オペレーションの重複

このエラーは、同じコンピューティング インスタンスに対して別のリクエストがすでに進行中のときに、障害のあるホストの修復 API にリクエストを送信すると発生します。また、コンピューティング インスタンスが REPAIRING 状態のままになることがあります。

エラー メッセージ:

FAILED_WITH_UNEXPECTED_STATUS

解決策: 最初の障害のあるホストの報告オペレーションが完了するまで待ってから、API に別のリクエストを送信します。コンピューティング インスタンスが応答しない場合は、API に別のリクエストを送信する前に、コンピューティング インスタンスを再起動します。

Fault reason is missing(障害の理由がありません)

このエラーは、ホストの障害を報告するリクエストで faultReasons フィールドを指定していない場合に発生します。

エラー メッセージ:

FAULT_REASONS_EMPTY_SHOULD_BE_SPECIFIED

解決策: faultReasons フィールドは必須です。この問題を解決するには、リクエストで faultReasons フィールドを指定します。

マシンタイプが正しくない

このエラーは、コンピューティング インスタンスがサポートされていないマシンタイプを使用している場合に発生します。

エラー メッセージ:

MACHINE_TYPE_NOT_SUPPORTED

解決策: 障害のあるホスト API のレポートは、A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)マシンタイプでのみサポートされています。

レート制限を超過した

エラー メッセージ:

RATE_LIMIT_EXCEEDED

理由: instances.reportHostAsFaulty メソッドのリクエスト上限を超えたか、リクエストを処理するのに十分な容量が Google にありません。

サポートされていないコンピューティング インスタンスの状態

このエラーは、コンピューティング インスタンスがサポートされていない状態の場合に発生します。

エラー メッセージ:

INSTANCE_SHOULD_BE_RUNNING

解決策: 障害のあるホスト API にリクエストを送信する前に、コンピューティング インスタンスが RUNNING 状態であることを確認します。