En esta guía se incluye una lista de errores que pueden producirse al usar la referencia de la API Model para la IA generativa. Los errores siguen el modelo de error de la API, que recomienda que proporcionemos orientación sobre las causas y las soluciones específicas de los modelos de IA generativa. Google Cloud
Errores de la API
En esta tabla se proporcionan los códigos de error y las descripciones de la API.
| Código de error HTTP | Código de error canónico | Causa | Ejemplo | Solución |
|---|---|---|---|---|
| 400 | INVALID_ARGUMENT / FAILED_PRECONDITION |
La solicitud no supera la validación de la API o has intentado acceder a un modelo que requiere que se te incluya en una lista de permitidos o que la política de la organización no permite. | La solicitud supera el límite de tokens de entrada del modelo. | Consulta los parámetros de solicitud, el recuento de tokens y otros parámetros en la referencia de la API Model de IA generativa . |
| 403 | PERMISSION_DENIED |
El cliente no tiene suficientes permisos para llamar a la API. | La cuenta de servicio no tiene permiso para acceder al segmento de Cloud Storage que aloja los recursos de imagen o vídeo. | 1. Verifica que todas las APIs necesarias estén habilitadas y que la cuenta de servicio tenga el permiso adecuado para acceder al servicio de Vertex AI seleccionado. 2. A la cuenta de servicio por producto y por proyecto (P4SA) de Vertex AI se le concede el permiso necesario para acceder a los recursos a los que se hace referencia en la entrada. |
| 404 | NOT_FOUND |
No se ha encontrado ningún objeto válido en la URL designada. | No se ha encontrado el archivo de imagen en la URL de almacenamiento. | Comprueba y corrige la ubicación del archivo. |
| 429 | RESOURCE_EXHAUSTED |
En función del mensaje de error, este puede deberse a lo siguiente: 1. Se ha superado el límite de cuota de la API. 2. Sobrecarga del servidor debido a la capacidad del servidor compartido. 3. Has alcanzado el límite diario de solicitudes con logprobs. |
La API de Gemini supera el límite de solicitudes por minuto. | 1. Consulta los límites de cuota de la IA generativa de Vertex AI. Si es necesario, solicita una cuota superior. 2. Vuelve a intentarlo en unos segundos. Si el error persiste durante un periodo prolongado (horas), ponte en contacto con el equipo de Asistencia de Vertex AI. 3. Plantéate comprar Capacidad de procesamiento reservada. |
| 499 | CANCELLED |
El cliente ha cancelado la solicitud. | ||
| 500 | UNKNOWN / INTERNAL |
Error del servidor debido a una sobrecarga o a un fallo de dependencia. | La solicitud se ha limitado porque el servicio está sobrecargado temporalmente. | Vuelve a intentarlo en unos segundos. Si el error persiste después de un periodo prolongado (horas), ponte en contacto con el equipo de Asistencia de Vertex AI. |
| 503 | UNAVAILABLE |
El servicio no está disponible temporalmente. | El servidor no responde a las solicitudes entrantes. | Es posible que el estado no disponible sea temporal. Sin embargo, si el error persiste, póngase en contacto con el equipo de Asistencia de Vertex AI. |
| 504 | DEADLINE_EXCEEDED |
La solicitud no se ha completado dentro del plazo. Si el cliente establece un plazo inferior al plazo predeterminado del servidor (10 minutos), se pueden producir errores 504. | El cliente establece un plazo de 10 segundos, que es demasiado corto para que se completen las solicitudes. | Quita el ajuste de plazo para usar el valor predeterminado del servidor (10 minutos) o define un plazo más largo. |
Gestionar errores
Evita los picos de tráfico. Los picos son aumentos repentinos y significativos del número de solicitudes en un periodo muy breve. A veces, los picos de tráfico pueden provocar problemas con la aplicación de las cuotas y aumentar las probabilidades de que se sobrecargue el servidor.
Ten cuidado al volver a intentar un evento. Te recomendamos que lo vuelvas a intentar dos veces como máximo. El retraso mínimo es de un segundo y las solicitudes posteriores se acumulan de forma exponencial.
Siguientes pasos
- La IA generativa en Vertex AI tiene algunas limitaciones. Para obtener más información, consulta las limitaciones de la API PaLM.
- Prueba un tutorial de inicio rápido con Vertex AI Studio o la API de Vertex AI.
- Explora los modelos preentrenados en Model Garden.
- Consulta información sobre las cuotas y los límites.
- Consulta información sobre los precios.