Erros da API de inferência da IA generativa no Vertex AI

Este guia fornece uma lista de erros que pode encontrar ao usar a referência da API Model para IA generativa. Os erros seguem o modelo de erro da API, que recomenda que forneçamos orientações sobre as causas e as soluções específicas dos modelos de IA generativa. Google Cloud

Erros da API

Esta tabela fornece códigos de erro e descrições da API.

Código de erro HTTP Código de erro canónico Causa Exemplo Solução
400 INVALID_ARGUMENT / FAILED_PRECONDITION O pedido falha a validação da API ou tentou aceder a um modelo que requer a inclusão numa lista de autorizações ou que não é permitido pela política da organização. O pedido excede o limite de tokens de entrada do modelo. Consulte a referência da API Model para IA generativa para ver parâmetros de pedidos, contagem de tokens e outros parâmetros.
403 PERMISSION_DENIED O cliente não tem autorização suficiente para chamar a API. A conta de serviço não tem autorização para aceder ao contentor do Cloud Storage que aloja recursos de imagem ou vídeo. 1. Verifique se todas as APIs necessárias estão ativadas e se a conta de serviço tem a autorização correta para aceder ao serviço do Vertex AI selecionado.

2. A conta de serviço (P4SA) por produto e por projeto do Vertex AI recebe a autorização necessária para aceder aos recursos referenciados na entrada.
404 NOT_FOUND Não foi encontrado nenhum objeto válido no URL designado. Não foi possível encontrar o ficheiro de imagem no URL de armazenamento. Verifique e corrija a localização do ficheiro.
429 RESOURCE_EXHAUSTED Consoante a mensagem de erro, o erro pode dever-se ao seguinte:

1. Quota da API acima do limite.

2. Sobrecarga do servidor devido à capacidade do servidor partilhada.

3. Atingiu o limite diário de pedidos com logprobs.
A API Gemini excede o limite de pedidos por minuto. 1. Verifique os limites de quota da IA generativa do Vertex AI. Se necessário, candidate-se a uma quota mais elevada.

2. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), contacte o apoio técnico do Vertex AI.

3. Considere comprar débito aprovisionado.
499 CANCELLED O pedido é cancelado pelo cliente.
500 UNKNOWN / INTERNAL Erro do servidor devido a sobrecarga ou falha de dependência. O pedido está limitado porque o serviço está temporariamente sobrecarregado. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), contacte o apoio técnico do Vertex AI.
503 UNAVAILABLE O serviço está temporariamente indisponível. O servidor não está a responder aos pedidos recebidos. O estado de indisponibilidade pode ser temporário. No entanto, se o erro persistir, contacte o apoio técnico da Vertex AI.
504 DEADLINE_EXCEEDED O pedido não foi concluído dentro do prazo. Se o cliente definir um prazo mais curto do que o prazo predefinido do servidor (10 minutos), podem ocorrer erros 504. O cliente define um prazo de 10 segundos, que é demasiado curto para a conclusão dos pedidos. Remova a definição de prazo para usar a predefinição do servidor (10 min) ou defina um prazo mais longo.

Processar erros

Evite picos de tráfego. Os picos são aumentos súbitos e significativos no número de pedidos num período muito curto. Por vezes, os picos de tráfego podem causar problemas na aplicação de quotas e aumentar a probabilidade de sobrecarga do servidor.

Tenha cuidado ao tentar novamente um evento. Recomendamos que não tente mais de duas vezes. O atraso mínimo é de um segundo, com os pedidos subsequentes a serem processados de forma exponencial.

O que se segue?