Generative KI in Vertex AI-Inferenz – API-Fehler

Dieser Leitfaden enthält eine Liste der Fehler, die bei der Verwendung der Modell API-Referenz für generative KI auftreten können. Die Fehler folgen dem Fehlermodell der Google Cloud API, das empfiehlt, dass wir Anleitungen zu den Ursachen und Lösungen speziell für die Modelle basierend auf generativer KI bereitstellen.

API-Fehler

Diese Tabelle enthält API-Fehlercodes und ‑Beschreibungen.

HTTP-Fehlercode Kanonischer Fehlercode Ursache Beispiel Lösung
400 INVALID_ARGUMENT / FAILED_PRECONDITION Die Anfrage schlägt für die API-Validierung fehl oder Sie haben versucht, auf ein Modell zuzugreifen, das eine Zulassungsliste erfordert oder von der Organisationsrichtlinie nicht zugelassen ist. Die Anfrage überschreitet das Limit für Eingabetokens des Modells. Weitere Informationen zu Anfrageparametern, Tokenanzahl und anderen Parametern finden Sie in der Modell API-Referenz für generative KI.
403 PERMISSION_DENIED Der Client hat nicht die erforderliche Berechtigung, die API aufzurufen. Das Dienstkonto hat keine Berechtigung für den Zugriff auf den Cloud Storage-Bucket, in dem Bild- oder Videoressourcen gehostet werden. 1. Prüfen Sie, ob alle erforderlichen APIs aktiviert sind und das Dienstkonto die richtige Berechtigung für den Zugriff auf den ausgewählten Vertex AI-Dienst hat.

2. Das produkt- und projektspezifische Vertex AI-Dienstkonto (P4SA) erhält die erforderliche Berechtigung für den Zugriff auf Ressourcen, auf die in der Eingabe verwiesen wird.
404 NOT_FOUND Unter der angegebenen URL wurde kein gültiges Objekt gefunden. Die Bilddatei wurde unter der Speicher-URL nicht gefunden. Prüfen und korrigieren Sie den Dateispeicherort.
429 RESOURCE_EXHAUSTED Je nach Fehlermeldung kann der Fehler folgende Ursachen haben:

1. API-Kontingent überschritten.

2. Serverüberlastung aufgrund der gemeinsamen Serverkapazität.

3. Sie haben das Tageslimit für Anfragen mit logprobs erreicht.
Gemini API überschreitet das Limit für Anfragen pro Minute. 1. Prüfen Sie die Kontingentlimits für generative KI von Vertex AI. Bei Bedarf können Sie ein höheres Kontingent beantragen.

2. Versuchen Sie es nach einigen Sekunden noch einmal. Wenn der Fehler nach längerer Zeit (Stunden) weiterhin auftritt, wenden Sie sich an den Vertex AI-Support.

3. Erwägen Sie den Kauf von Provisioned Throughput.
499 CANCELLED Die Anfrage wurde vom Client abgebrochen.
500 UNKNOWN / INTERNAL Serverfehler aufgrund von Überlastung oder Abhängigkeitsfehler. Die Anfrage wird gedrosselt, weil der Dienst vorübergehend überlastet ist. Versuchen Sie es nach einigen Sekunden noch einmal. Wenn der Fehler nach längerer Zeit (Stunden) weiterhin auftritt, wenden Sie sich an den Vertex AI-Support.
503 UNAVAILABLE Der Dienst ist vorübergehend nicht verfügbar. Der Server reagiert nicht auf eingehende Anfragen. Der Status „Nicht verfügbar“ ist möglicherweise nur vorübergehend. Wenn der Fehler weiterhin auftritt, wenden Sie sich an den Vertex AI-Support.
504 DEADLINE_EXCEEDED Der Client legt eine Frist fest, die kürzer als die Standardfrist des Servers (10 Minuten) ist, und die Anfrage wurde nicht innerhalb der vom Client bereitgestellten Frist abgeschlossen. Sie sollten die vom Kunden angegebene Frist verlängern.

Fehler verarbeiten

Vermeiden Sie Trafficspitzen. Spitzen sind plötzliche und erhebliche Erhöhungen der Anzahl der Anfragen innerhalb eines sehr kurzen Zeitraums. Manchmal können Trafficspitzen zu Problemen bei der Kontingenterzwingung führen und das Risiko einer Serverüberlastung erhöhen.

Seien Sie vorsichtig beim Wiederholen eines Ereignisses. Wir empfehlen, Wiederholungen nicht mehr als zweimal auszuführen. Die Mindestverzögerung beträgt eine Sekunde, wobei nachfolgende Anfragen sich exponentiell anstauen.

Nächste Schritte