La documentazione di Vertex AI non viene più aggiornata

I servizi di Vertex AI ora fanno parte di Gemini Enterprise Agent Platform. Per informazioni aggiornate, consulta la documentazione di Agent Platform.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Errori dell'API di inferenza dell'IA generativa su Vertex AI

Questa guida fornisce un elenco di errori che potresti riscontrare durante l'utilizzo del riferimento dell'API Model per l'AI generativa. Gli errori seguono il modello di errore dell' Google Cloud API, che consiglia di fornire indicazioni sulle cause e sulle soluzioni specifiche per i modelli di AI generativa.

Errori API

Questa tabella fornisce i codici e le descrizioni degli errori API.

Codice di errore HTTP	Codice di errore canonico	Causa	Esempio	Soluzione
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	La richiesta non supera la convalida dell'API o hai tentato di accedere a un modello che richiede l'inserimento nella lista consentita o non è consentito dalla policy dell'organizzazione.	La richiesta supera il limite di token di input del modello.	Consulta il riferimento dell'API Model per l'AI generativa per i parametri della richiesta, il conteggio dei token e altri parametri.
401	`UNAUTHENTICATED`	La richiesta non è autenticata a causa di un token OAuth mancante, non valido o scaduto.	La richiesta ha credenziali di autenticazione non valide.	Verifica che l'intestazione Authorization contenga un token di accesso valido. Se utilizzi Google Cloud CLI, esegui `gcloud auth print-access-token` per generare un token valido.
403	`PERMISSION_DENIED`	Il client non dispone di autorizzazioni sufficienti per chiamare l'API.	Il service account non dispone dell'autorizzazione per accedere al bucket Cloud Storage che ospita risorse di immagini o video.	1. Verifica che tutte le API necessarie siano abilitate e che il account di servizio disponga dell'autorizzazione corretta per accedere al servizio Vertex AI selezionato. 2. Account di servizio per prodotto e per progetto (P4SA) di Vertex AI viene concessa l'autorizzazione necessaria per accedere alle risorse a cui viene fatto riferimento nell'input.
404	`NOT_FOUND`	Non viene trovato alcun oggetto valido dall'URL designato.	File immagine non trovato nell'URL di archiviazione.	Controlla e correggi la posizione del file.
429	`RESOURCE_EXHAUSTED`	A seconda del messaggio di errore, l'errore potrebbe essere causato da: 1. Quota API oltre il limite. 2. Sovraccarico del server a causa della capacità del server condivisa. 3. Hai raggiunto il limite giornaliero per le richieste che utilizzano `logprobs`.	L'API Gemini supera il limite di richieste al minuto.	1. Controlla i limiti di quota dell'AI generativa di Vertex AI. Se necessario, richiedi una quota più elevata. 2. Riprova dopo qualche secondo. Se l'errore persiste per un periodo di tempo prolungato (ore), contatta l'assistenza di Vertex AI. 3. Valuta l'acquisto di un throughput sottoposto a provisioning.
499	`CANCELLED`	La richiesta viene annullata dal client.
500	`UNKNOWN / INTERNAL`	Errore del server dovuto a sovraccarico o errore di dipendenza.	La richiesta è soggetta a limitazione perché il servizio è temporaneamente sovraccarico.	Riprova dopo qualche secondo. Se l'errore persiste per un periodo di tempo prolungato (ore), contatta l'assistenza di Vertex AI.
503	`UNAVAILABLE`	Il servizio non è temporaneamente disponibile.	Il server non risponde alle richieste in entrata.	Lo stato di non disponibilità potrebbe essere temporaneo. Tuttavia, se l'errore persiste, contatta l'assistenza di Vertex AI.
504	`DEADLINE_EXCEEDED`	La richiesta non è stata completata entro la scadenza. Se il client imposta una scadenza più breve di quella predefinita del server, potrebbero verificarsi errori 504.	Il client imposta una scadenza di 10 secondi, che è troppo breve per il completamento delle richieste.	Rimuovi l'impostazione della scadenza per utilizzare quella predefinita del server o imposta una scadenza più lunga.

Gestisci gli errori

Evita picchi di traffico. I picchi sono aumenti improvvisi e significativi del numero di richieste in un periodo di tempo molto breve. A volte, i picchi di traffico potrebbero causare problemi per l'applicazione delle quote e aumentare la probabilità di sovraccarico del server.

Fai attenzione a riprovare un evento. Ti consigliamo di riprovare non più di due volte. Il ritardo minimo è di un secondo, con le richieste successive che vengono eseguite in modo esponenziale. Per ulteriori informazioni, consulta Strategia di ripetizione.

Passaggi successivi

L'AI generativa su Vertex AI presenta alcune limitazioni. Per saperne di più, consulta Limitazioni dell'API PaLM.
Prova un tutorial di avvio rapido utilizzando Vertex AI Studio o l'API Vertex AI.
Esplora i modelli preaddestrati in Model Garden.
Scopri di più su quote e limiti.
Scopri di più sui prezzi.

La documentazione di Vertex AI non viene più aggiornata

Errori dell'API di inferenza dell'IA generativa su Vertex AI Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Errori API

Gestisci gli errori

Passaggi successivi

Errori dell'API di inferenza dell'IA generativa su Vertex AI