במדריך הזה מפורטת רשימה של שגיאות שיכולות להתרחש כשמשתמשים בהפניית API ל-Model ל-AI גנרטיבי. השגיאות תואמות למודל השגיאות של Google Cloud API, שבו מומלץ לספק הנחיות לגבי הסיבות לשגיאות והפתרונות הספציפיים למודלים של AI גנרטיבי.
שגיאות API
בטבלה הזו מפורטים קודי השגיאה של ה-API והתיאורים שלהם.
| קוד שגיאת HTTP | קוד שגיאה קנוני | מטרה | דוגמה | פתרון |
|---|---|---|---|---|
| 400 | INVALID_ARGUMENT / FAILED_PRECONDITION |
הבקשה נכשלת באימות של ה-API, או שניסיתם לגשת למודל שנדרש להוסיף אותו לרשימת ההיתרים או שהוא לא מורשה לפי המדיניות של הארגון. | הבקשה חורגת ממגבלת הטוקנים של הקלט של המודל. | פרמטרים של בקשות, ספירת אסימונים ופרמטרים אחרים מפורטים בהפניית Model API ל-AI גנרטיבי . |
| 401 | UNAUTHENTICATED |
הבקשה לא אומתה כי טוקן ה-OAuth חסר, לא חוקי או שתוקפו פג. | בבקשה צוינו פרטי כניסה לאימות לא תקינים. | מוודאים שכותרת ההרשאה מכילה אסימון גישה תקין. אם משתמשים ב-Google Cloud CLI, מריצים את הפקודה gcloud auth print-access-token כדי ליצור אסימון תקין. |
| 403 | PERMISSION_DENIED |
ללקוח אין הרשאה מספקת כדי לבצע קריאה ל-API. | לחשבון השירות אין הרשאה לגשת לקטגוריית Cloud Storage שבה מתארחים משאבי התמונות או הסרטונים. | 1. מוודאים שכל ממשקי ה-API הדרושים מופעלים, ושלחשבון השירות יש את ההרשאה הנכונה לגשת לשירות Vertex AI שנבחר. 2. לחשבון השירות (P4SA) של Vertex AI לכל מוצר ולכל פרויקט מוענקות ההרשאות הנדרשות לגישה למשאבים שמצוינים בקלט. |
| 404 | NOT_FOUND |
לא נמצא אובייקט תקין בכתובת ה-URL שצוינה. | קובץ התמונה לא נמצא בכתובת ה-URL של האחסון. | בודקים ומתקנים את מיקום הקובץ. |
| 429 | RESOURCE_EXHAUSTED |
בהתאם להודעת השגיאה, יכול להיות שהשגיאה נגרמת בגלל אחת מהסיבות הבאות: 1. חריגה מהמגבלה של מכסת ה-API. 2. עומס יתר בשרת בגלל קיבולת שרת משותפת. 3. הגעת למכסה היומית של בקשות באמצעות logprobs. |
חריגה ממגבלת הבקשות לדקה ב-Gemini API. | 1. כדאי לעיין במכסות של AI גנרטיבי ב-Vertex AI. אם צריך, שולחים בקשה להגדלת המכסה. 2. כדאי לנסות שוב אחרי כמה שניות. אם השגיאה נמשכת לאורך זמן (שעות), צריך לפנות לתמיכה של Vertex AI. 3. כדאי לשקול רכישה של הקצאת משאבים לפי התפוקה שנקבעה. |
| 499 | CANCELLED |
הבקשה בוטלה על ידי הלקוח. | ||
| 500 | UNKNOWN / INTERNAL |
שגיאת שרת בגלל עומס יתר או כשל בתלות. | הבקשה מוגבלת, כי השירות עמוס מדי באופן זמני. | כדאי לנסות שוב אחרי כמה שניות. אם השגיאה נמשכת אחרי פרק זמן ממושך (שעות), צריך לפנות לתמיכה של Vertex AI. |
| 503 | UNAVAILABLE |
השירות לא זמין כרגע. | השרת לא מגיב לבקשות הנכנסות. | יכול להיות שהסטטוס 'לא זמין' הוא זמני. עם זאת, אם השגיאה נמשכת, צריך לפנות לתמיכה של Vertex AI. |
| 504 | DEADLINE_EXCEEDED |
הבקשה לא הושלמה עד המועד האחרון. אם הלקוח מגדיר מועד אחרון קצר יותר מהמועד האחרון שמוגדר כברירת מחדל בשרת (10 דקות), יכול להיות שיוחזרו שגיאות 504. | הלקוח מגדיר זמן קצוב של 10 שניות, שהוא קצר מדי כדי שהבקשות יסתיימו. | כדי להשתמש בברירת המחדל של השרת (10 דקות), צריך להסיר את הגדרת מועד סיום ההרשמה, או להגדיר מועד סיום ארוך יותר. |
טיפול בשגיאות
כדאי להימנע מעליות חדות בתנועת הגולשים. עלייה חדה היא עלייה פתאומית ומשמעותית במספר הבקשות בפרק זמן קצר מאוד. לפעמים, עליות חדות בתנועת הגולשים עלולות לגרום לבעיות באכיפת המכסה ולהגדיל את הסיכוי לעומס יתר על השרת.
צריך להיזהר כשמנסים שוב להפעיל אירוע. מומלץ לנסות שוב עד פעמיים. העיכוב המינימלי הוא שנייה אחת, והבקשות הבאות מתעכבות באופן מעריכי. מידע נוסף זמין במאמר בנושא אסטרטגיית ניסיון חוזר.
המאמרים הבאים
- יש כמה מגבלות ל-AI גנרטיבי ב-Vertex AI. מידע נוסף זמין במאמר בנושא מגבלות של PaLM API.
- אפשר לנסות מדריך למתחילים באמצעות Vertex AI Studio או Vertex AI API.
- אפשר לעיין במודלים שאומנו מראש ב-Model Garden.
- מידע נוסף על מכסות ומגבלות
- מידע נוסף על תמחור