שגיאות ב-Vertex AI inference API של AI גנרטיבי

במדריך הזה מפורטת רשימה של שגיאות שיכולות להתרחש כשמשתמשים בהפניית API ל-Model ל-AI גנרטיבי. השגיאות תואמות למודל השגיאות של Google Cloud API, שבו מומלץ לספק הנחיות לגבי הסיבות לשגיאות והפתרונות הספציפיים למודלים של AI גנרטיבי.

שגיאות API

בטבלה הזו מפורטים קודי השגיאה של ה-API והתיאורים שלהם.

קוד שגיאת HTTP קוד שגיאה קנוני מטרה דוגמה פתרון
400 INVALID_ARGUMENT / FAILED_PRECONDITION הבקשה נכשלת באימות של ה-API, או שניסיתם לגשת למודל שנדרש להוסיף אותו לרשימת ההיתרים או שהוא לא מורשה לפי המדיניות של הארגון. הבקשה חורגת ממגבלת הטוקנים של הקלט של המודל. פרמטרים של בקשות, ספירת אסימונים ופרמטרים אחרים מפורטים בהפניית Model API ל-AI גנרטיבי .
401 UNAUTHENTICATED הבקשה לא אומתה כי טוקן ה-OAuth חסר, לא חוקי או שתוקפו פג. בבקשה צוינו פרטי כניסה לאימות לא תקינים. מוודאים שכותרת ההרשאה מכילה אסימון גישה תקין. אם משתמשים ב-Google Cloud CLI, מריצים את הפקודה gcloud auth print-access-token כדי ליצור אסימון תקין.
403 PERMISSION_DENIED ללקוח אין הרשאה מספקת כדי לבצע קריאה ל-API. לחשבון השירות אין הרשאה לגשת לקטגוריית Cloud Storage שבה מתארחים משאבי התמונות או הסרטונים. 1. מוודאים שכל ממשקי ה-API הדרושים מופעלים, ושלחשבון השירות יש את ההרשאה הנכונה לגשת לשירות Vertex AI שנבחר.

‫2. לחשבון השירות (P4SA) של Vertex AI לכל מוצר ולכל פרויקט מוענקות ההרשאות הנדרשות לגישה למשאבים שמצוינים בקלט.
404 NOT_FOUND לא נמצא אובייקט תקין בכתובת ה-URL שצוינה. קובץ התמונה לא נמצא בכתובת ה-URL של האחסון. בודקים ומתקנים את מיקום הקובץ.
429 RESOURCE_EXHAUSTED בהתאם להודעת השגיאה, יכול להיות שהשגיאה נגרמת בגלל אחת מהסיבות הבאות:

‫1. חריגה מהמגבלה של מכסת ה-API.

‫2. עומס יתר בשרת בגלל קיבולת שרת משותפת.

‫3. הגעת למכסה היומית של בקשות באמצעות logprobs.
חריגה ממגבלת הבקשות לדקה ב-Gemini API. 1. כדאי לעיין במכסות של AI גנרטיבי ב-Vertex AI. אם צריך, שולחים בקשה להגדלת המכסה.

‫2. כדאי לנסות שוב אחרי כמה שניות. אם השגיאה נמשכת לאורך זמן (שעות), צריך לפנות לתמיכה של Vertex AI.

‫3. כדאי לשקול רכישה של הקצאת משאבים לפי התפוקה שנקבעה.
499 CANCELLED הבקשה בוטלה על ידי הלקוח.
500 UNKNOWN / INTERNAL שגיאת שרת בגלל עומס יתר או כשל בתלות. הבקשה מוגבלת, כי השירות עמוס מדי באופן זמני. כדאי לנסות שוב אחרי כמה שניות. אם השגיאה נמשכת אחרי פרק זמן ממושך (שעות), צריך לפנות לתמיכה של Vertex AI.
503 UNAVAILABLE השירות לא זמין כרגע. השרת לא מגיב לבקשות הנכנסות. יכול להיות שהסטטוס 'לא זמין' הוא זמני. עם זאת, אם השגיאה נמשכת, צריך לפנות לתמיכה של Vertex AI.
504 DEADLINE_EXCEEDED הבקשה לא הושלמה עד המועד האחרון. אם הלקוח מגדיר מועד אחרון קצר יותר מהמועד האחרון שמוגדר כברירת מחדל בשרת (10 דקות), יכול להיות שיוחזרו שגיאות 504. הלקוח מגדיר זמן קצוב של 10 שניות, שהוא קצר מדי כדי שהבקשות יסתיימו. כדי להשתמש בברירת המחדל של השרת (10 דקות), צריך להסיר את הגדרת מועד סיום ההרשמה, או להגדיר מועד סיום ארוך יותר.

טיפול בשגיאות

כדאי להימנע מעליות חדות בתנועת הגולשים. עלייה חדה היא עלייה פתאומית ומשמעותית במספר הבקשות בפרק זמן קצר מאוד. לפעמים, עליות חדות בתנועת הגולשים עלולות לגרום לבעיות באכיפת המכסה ולהגדיל את הסיכוי לעומס יתר על השרת.

צריך להיזהר כשמנסים שוב להפעיל אירוע. מומלץ לנסות שוב עד פעמיים. העיכוב המינימלי הוא שנייה אחת, והבקשות הבאות מתעכבות באופן מעריכי. מידע נוסף זמין במאמר בנושא אסטרטגיית ניסיון חוזר.

המאמרים הבאים