Generative KI in Vertex AI-Inferenz – API-Fehler

Dieser Leitfaden enthält eine Liste der Fehler, die bei der Verwendung der Modell API-Referenz für generative KI auftreten können. Die Fehler folgen dem Fehlermodell der Google Cloud API, das empfiehlt, dass wir Anleitungen zu den Ursachen und Lösungen speziell für die Modelle basierend auf generativer KI bereitstellen.

API-Fehler

Diese Tabelle enthält API-Fehlercodes und -beschreibungen.

HTTP-Fehlercode	Kanonischer Fehlercode	Ursache	Beispiel	Lösung
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	Die Anfrage schlägt für die API-Validierung fehl oder Sie haben versucht, auf ein Modell zuzugreifen, das eine Zulassungsliste erfordert oder von der Organisationsrichtlinie nicht zugelassen ist.	Die Anfrage überschreitet das Limit für Eingabetokens des Modells.	Weitere Informationen zu Anfrageparametern, Tokenanzahl und anderen Parametern finden Sie in der Modell API-Referenz für generative KI .
401	`UNAUTHENTICATED`	Die Anfrage wurde aufgrund eines fehlenden, ungültigen oder abgelaufenen OAuth-Tokens nicht authentifiziert.	Request had invalid authentication credentials.	Prüfen Sie, ob der Autorisierungsheader ein gültiges Zugriffstoken enthält. Wenn Sie die Google Cloud CLI verwenden, führen Sie `gcloud auth print-access-token` aus, um ein gültiges Token zu generieren.
403	`PERMISSION_DENIED`	Der Client hat nicht die erforderliche Berechtigung zum Aufrufen der API.	Das Dienstkonto hat keine Berechtigung für den Zugriff auf den Cloud Storage-Bucket, in dem Bild- oder Videoressourcen gehostet werden.	1. Prüfen Sie, ob alle erforderlichen APIs aktiviert sind und das Dienstkonto die richtige Berechtigung für den Zugriff auf den ausgewählten Vertex AI-Dienst hat. 2. Das produkt- und projektspezifische Vertex AI-Dienstkonto (P4SA) erhält die erforderliche Berechtigung für den Zugriff auf Ressourcen, auf die in der Eingabe verwiesen wird.
404	`NOT_FOUND`	Unter der angegebenen URL wurde kein gültiges Objekt gefunden.	Die Bilddatei wurde in der Speicher-URL nicht gefunden.	Prüfen und korrigieren Sie den Speicherort der Datei.
429	`RESOURCE_EXHAUSTED`	Je nach Fehlermeldung kann der Fehler folgende Ursachen haben: 1. Das API-Kontingent wurde überschritten. 2. Serverüberlastung aufgrund gemeinsamer Serverkapazität. 3. Sie haben das Tageslimit für Anfragen mit `logprobs` erreicht.	Gemini API überschreitet das Limit für Anfragen pro Minute.	1. Prüfen Sie die Kontingentlimits für generative KI von Vertex AI. Beantragen Sie bei Bedarf ein höheres Kontingent. 2. Wiederholen Sie den Vorgang nach einigen Sekunden. Wenn der Fehler nach längerer Zeit (Stunden) weiterhin auftritt, wenden Sie sich an den Vertex AI-Support. 3. Erwägen Sie den Kauf von Bereitgestellter Durchsatz.
499	`CANCELLED`	Die Anfrage wurde vom Client abgebrochen.
500	`UNKNOWN / INTERNAL`	Serverfehler aufgrund von Überlastung oder Abhängigkeitsfehlern.	Die Anfrage wird gedrosselt, weil der Dienst vorübergehend überlastet ist.	Wiederholen Sie den Vorgang nach einigen Sekunden. Wenn der Fehler nach längerer Zeit (Stunden) weiterhin auftritt, wenden Sie sich an den Vertex AI-Support.
503	`UNAVAILABLE`	Der Dienst ist vorübergehend nicht verfügbar.	Der Server reagiert nicht auf eingehende Anfragen.	Der Status „Nicht verfügbar“ ist möglicherweise nur vorübergehend. Wenn der Fehler jedoch weiterhin auftritt, wenden Sie sich an den Vertex AI-Support.
504	`DEADLINE_EXCEEDED`	Die Anfrage wurde nicht innerhalb der Frist abgeschlossen. Wenn der Client eine Frist festlegt, die kürzer als die Standardfrist des Servers ist, kann dies zu 504-Fehlern führen.	Der Client legt eine Frist von 10 Sekunden fest, die zu kurz ist, um die Anfragen abzuschließen.	Entfernen Sie die Fristfestlegung, um die Standardeinstellung des Servers zu verwenden, oder legen Sie eine längere Frist fest.

Fehler verarbeiten

Vermeiden Sie Trafficspitzen. Spitzen sind plötzliche und erhebliche Erhöhungen der Anzahl der Anfragen innerhalb eines sehr kurzen Zeitraums. Manchmal können Trafficspitzen zu Problemen bei der Kontingenterzwingung führen und das Risiko einer Serverüberlastung erhöhen.

Seien Sie vorsichtig beim Wiederholen eines Ereignisses. Wir empfehlen, Wiederholungen nicht mehr als zweimal auszuführen. Die Mindestverzögerung beträgt eine Sekunde, wobei nachfolgende Anfragen sich exponentiell anstauen. Weitere Informationen finden Sie unter Strategie für Wiederholungen.

Nächste Schritte

Für die generative KI für Vertex AI gelten einige Einschränkungen. Weitere Informationen finden Sie unter Einschränkungen der PaLM API.
Wagen Sie sich an eine Kurzeinführung mit Vertex AI Studio oder der Vertex AI API.
Vortrainierte Modelle in Model Garden untersuchen.
Informationen zu Kontingenten und Limits
Informationen zu Preisen.

Generative KI in Vertex AI-Inferenz – API-Fehler Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

API-Fehler

Fehler verarbeiten

Nächste Schritte

Generative KI in Vertex AI-Inferenz – API-Fehler