Erreurs de l'API d'inférence de l'IA générative sur Vertex AI

Ce guide fournit une liste des erreurs que vous pouvez rencontrer lors de l'utilisation de la documentation de référence de l'API du modèle pour l'IA générative. Les erreurs suivent le modèle d'erreur de l'API Google Cloud , qui nous recommande de fournir des conseils sur les causes possibles et sur les solutions spécifiques aux modèles d'IA générative.

Erreurs d'API

Ce tableau fournit les codes d'erreur et les descriptions de l'API.

Code d'erreur HTTP	Code d'erreur canonique	Cause	Exemple	Solution
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	La validation de l'API pour la requête a échoué, ou vous avez tenté d'accéder à un modèle qui nécessite une autorisation ou qui n'est pas autorisé par le règlement de l'organisation.	La requête dépasse la limite de jetons d'entrée du modèle.	Pour en savoir plus sur les paramètres de requête, le nombre de jetons et d'autres paramètres, consultez la documentation de référence de l'API du modèle pour l'IA générative .
401	`UNAUTHENTICATED`	La requête n'a pas été authentifiée en raison d'un jeton OAuth manquant, non valide ou ayant expiré.	Les identifiants d'authentification de la requête ne sont pas valides.	Vérifiez que l'en-tête "Authorization" contient un jeton d'accès valide. Si vous utilisez Google Cloud CLI, exécutez `gcloud auth print-access-token` pour générer un jeton valide.
403	`PERMISSION_DENIED`	Le client ne dispose pas des autorisations nécessaires pour appeler l'API.	Le compte de service n'est pas autorisé à accéder au bucket Cloud Storage qui héberge les ressources d'image ou de vidéo.	1. Vérifiez que toutes les API nécessaires sont activées et que le compte de service dispose de la permission appropriée pour accéder au service Vertex AI sélectionné. 2. Le compte de service par produit et par projet (P4SA) Vertex AI dispose des autorisations nécessaires pour accéder aux ressources référencées dans l'entrée.
404	`NOT_FOUND`	Aucun objet valide n'a été trouvé à l'URL indiquée.	Le fichier image est introuvable dans l'URL de stockage.	Vérifiez l'emplacement du fichier et effectuez les corrections nécessaires.
429	`RESOURCE_EXHAUSTED`	Selon le message d'erreur, le problème peut être dû aux éléments suivants : 1. Quota d'API dépassé. 2. Une surcharge du serveur en raison de la capacité du serveur partagé. 3. Vous avez atteint la limite quotidienne de requêtes utilisant `logprobs`.	L'API Gemini dépasse la limite de requêtes par minute.	1. Vérifiez les limites de quota de l'IA générative sur Vertex AI. Si nécessaire, demandez un quota supérieur. 2. Réessayez dans quelques secondes. Si l'erreur persiste après une longue période (plusieurs heures), contactez l'assistance Vertex AI. 3. Envisagez d'acheter du débit provisionné.
499	`CANCELLED`	La demande a été annulée par le client.
500	`UNKNOWN / INTERNAL`	Erreur du serveur due à une surcharge ou à une défaillance de dépendance.	La requête est limitée, car le service est temporairement surchargé.	Réessayez dans quelques secondes. Si l'erreur persiste après une longue période (plusieurs heures), contactez l'assistance Vertex AI.
503	`UNAVAILABLE`	Le service est momentanément indisponible.	Le serveur ne répond pas aux requêtes entrantes.	Il est possible que l'état "Indisponible" soit temporaire. Toutefois, si l'erreur persiste, contactez l'assistance Vertex AI.
504	`DEADLINE_EXCEEDED`	La requête n'a pas été traitée dans le délai imparti. Si le client définit un délai plus court que le délai par défaut du serveur (10 minutes), cela peut entraîner des erreurs 504.	Le client définit un délai de 10 secondes, ce qui est trop court pour que les requêtes se terminent.	Supprimez le paramètre de délai pour utiliser la valeur par défaut du serveur (10 minutes) ou définissez un délai plus long.

Gérer les erreurs

Évitez les pics de trafic. Les pics sont des augmentations soudaines et significatives du nombre de requêtes sur une très courte période. Parfois, les pics de trafic peuvent entraîner des problèmes d'application des quotas et augmenter le risque de surcharge du serveur.

Soyez prudent lorsque vous réessayez un événement. Nous vous recommandons de ne pas réessayer plus de deux fois. Le délai minimal est d'une seconde, et les requêtes suivantes sont mises en file d'attente de manière exponentielle. Pour en savoir plus, consultez Stratégie de nouvelle tentative.

Étapes suivantes

Generative AI sur Vertex AI présente certaines limites. Pour en savoir plus, consultez la section Limites de l'API PaLM.
Suivez un tutoriel de démarrage rapide sur Vertex AI Studio ou sur l'API Vertex AI.
Découvrez les modèles pré-entraînés dans Model Garden.
En savoir plus sur les quotas et limites.
En savoir plus sur les tarifs.

Erreurs de l'API d'inférence de l'IA générative sur Vertex AI Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Erreurs d'API

Gérer les erreurs

Étapes suivantes

Erreurs de l'API d'inférence de l'IA générative sur Vertex AI