Erros da API de inferência da IA generativa no Vertex AI

Este guia fornece uma lista de erros que pode encontrar ao usar a referência da API Model para IA generativa. Os erros seguem o modelo de erro da API, que recomenda que forneçamos orientações sobre as causas e as soluções específicas dos modelos de IA generativa. Google Cloud

Erros da API

Esta tabela fornece códigos de erro e descrições da API.

Código de erro HTTP	Código de erro canónico	Causa	Exemplo	Solução
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	O pedido falha a validação da API ou tentou aceder a um modelo que requer a inclusão numa lista de autorizações ou que não é permitido pela política da organização.	O pedido excede o limite de tokens de entrada do modelo.	Consulte a referência da API Model para IA generativa para ver parâmetros de pedidos, contagem de tokens e outros parâmetros.
403	`PERMISSION_DENIED`	O cliente não tem autorização suficiente para chamar a API.	A conta de serviço não tem autorização para aceder ao contentor do Cloud Storage que aloja recursos de imagem ou vídeo.	1. Verifique se todas as APIs necessárias estão ativadas e se a conta de serviço tem a autorização correta para aceder ao serviço do Vertex AI selecionado. 2. A conta de serviço (P4SA) por produto e por projeto do Vertex AI recebe a autorização necessária para aceder aos recursos referenciados na entrada.
404	`NOT_FOUND`	Não foi encontrado nenhum objeto válido no URL designado.	Não foi possível encontrar o ficheiro de imagem no URL de armazenamento.	Verifique e corrija a localização do ficheiro.
429	`RESOURCE_EXHAUSTED`	Consoante a mensagem de erro, o erro pode dever-se ao seguinte: 1. Quota da API acima do limite. 2. Sobrecarga do servidor devido à capacidade do servidor partilhada. 3. Atingiu o limite diário de pedidos com `logprobs`.	A API Gemini excede o limite de pedidos por minuto.	1. Verifique os limites de quota da IA generativa do Vertex AI. Se necessário, candidate-se a uma quota mais elevada. 2. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), contacte o apoio técnico do Vertex AI. 3. Considere comprar débito aprovisionado.
499	`CANCELLED`	O pedido é cancelado pelo cliente.
500	`UNKNOWN / INTERNAL`	Erro do servidor devido a sobrecarga ou falha de dependência.	O pedido está limitado porque o serviço está temporariamente sobrecarregado.	Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), contacte o apoio técnico do Vertex AI.
503	`UNAVAILABLE`	O serviço está temporariamente indisponível.	O servidor não está a responder aos pedidos recebidos.	O estado de indisponibilidade pode ser temporário. No entanto, se o erro persistir, contacte o apoio técnico da Vertex AI.
504	`DEADLINE_EXCEEDED`	O pedido não foi concluído dentro do prazo. Se o cliente definir um prazo mais curto do que o prazo predefinido do servidor (10 minutos), podem ocorrer erros 504.	O cliente define um prazo de 10 segundos, que é demasiado curto para a conclusão dos pedidos.	Remova a definição de prazo para usar a predefinição do servidor (10 min) ou defina um prazo mais longo.

Processar erros

Evite picos de tráfego. Os picos são aumentos súbitos e significativos no número de pedidos num período muito curto. Por vezes, os picos de tráfego podem causar problemas na aplicação de quotas e aumentar a probabilidade de sobrecarga do servidor.

Tenha cuidado ao tentar novamente um evento. Recomendamos que não tente mais de duas vezes. O atraso mínimo é de um segundo, com os pedidos subsequentes a serem processados de forma exponencial.

O que se segue?

A IA generativa no Vertex AI tem algumas limitações. Para saber mais, consulte as limitações da API PaLM.
Experimente um tutorial de início rápido com o Vertex AI Studio ou a API Vertex AI.
Explore modelos pré-treinados no Model Garden.
Saiba mais sobre as quotas e os limites.
Saiba mais acerca dos preços.

Erros da API de inferência da IA generativa no Vertex AI Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Erros da API

Processar erros

O que se segue?

Erros da API de inferência da IA generativa no Vertex AI