אם מספר הבקשות חורג מהקיבולת שהוקצתה לעיבוד הבקשות, קוד השגיאה 429 מוחזר. בטבלה הבאה מוצגת הודעת השגיאה שנוצרת על ידי כל סוג של מסגרת מכסות:
| מסגרת המכסות | הודעה |
|---|---|
| Pay-as-you-go | Resource exhausted, please try again later. |
| הקצאת משאבים לפי התפוקה שנקבעה | Too many requests. Exceeded the Provisioned Throughput. |
עם מינוי הקצאת משאבים לפי התפוקה שנקבעה, אתם יכולים לשריין כמות של תפוקה למודלים ספציפיים של AI גנרטיבי. אם אין לכם מינוי הקצאת משאבים לפי התפוקה שנקבעה והמשאבים לא זמינים לאפליקציה שלכם, מוחזר קוד השגיאה 429. למרות שאין לכם קיבולת שמורה, אתם יכולים לנסות לשלוח את הבקשה שוב. עם זאת, הבקשה לא נספרת במסגרת שיעור השגיאות שלכם, כפי שמתואר בהסכם רמת השירות (SLA).
בפרויקטים שבהם נרכשה הקצאת משאבים לפי התפוקה שנקבעה, מערכת Vertex AI מודדת את התפוקה של הפרויקט ושומרת את הכמות שנרכשה לשימוש בפועל בפרויקט.
במצב 'הקצאת משאבים לפי התפוקה שנקבעה' רגילה, אם משתמשים בפחות מהכמות שנרכשה, שגיאות שאחרת היו 429 מוחזרות בתור 5XX ונכללות בשיעור השגיאות של ה-SLA. במקרה של Single Zone Provisioned Throughput (הקצאת משאבים לפי התפוקה שנקבעה באזור יחיד), אם משתמשים בפחות מהכמות שנרכשה, שגיאות שקשורות לקיבולת 429 נחשבות כ5XX אבל לא נספרות בשיעור השגיאות בהסכם ה-SLA. אם חורגים מהכמות שנרכשה, הבקשות הנוספות מטופלות על פי דרישה בתשלום לפי שימוש.
Pay-as-you-go
במסגרת מכסת השימוש בתשלום לפי שימוש, יש לכם את האפשרויות הבאות לפתרון שגיאות 429:
- אם אפשר, השתמשו בנקודת הקצה הגלובלית במקום בנקודת קצה אזורית.
- כדי להטמיע אסטרטגיה לביצוע ניסיונות חוזרים, צריך להשתמש בהשהיה מעריכית קטועה לפני ניסיון חוזר (truncated exponential backoff).
- אם המודל שלכם משתמש במכסות, אתם יכולים לשלוח בקשה להגדלת המכסה (QIR). אם המודל שלכם משתמש בתשלום רגיל לפי שימוש, כדאי להחליק את התנועה ולהפחית את העליות החדות.
- כדי לקבל רמת שירות עקבית יותר, אפשר להירשם ל-הקצאת משאבים לפי התפוקה שנקבעה. מידע נוסף זמין במאמר בנושא הקצאת משאבים לפי התפוקה שנקבעה.
הקצאת משאבים לפי התפוקה שנקבעה
כדי לתקן את השגיאה 429 שנוצרת על ידי הקצאת משאבים לפי התפוקה שנקבעה, צריך לבצע את הפעולות הבאות:
- משתמשים בדוגמה של התנהגות ברירת המחדל, שבה לא מוגדר כותר בבקשות לחיזוי. חריגות מעל המכסה מטופלות על פי דרישה ומחויבות בתשלום לפי שימוש.
- הגדלת מספר יחידות ה-GSU במינוי הקצאת משאבים לפי התפוקה שנקבעה.
המאמרים הבאים
- מידע נוסף על תוכנית Standard תשלום לפי שימוש זמין במאמר בנושא Standard pay-as-you-go.
- מידע נוסף על תפוקה שהוקצתה
- מידע על מכסות ומגבלות ב-Vertex AI זמין במאמר בנושא מכסות ומגבלות ב-Vertex AI.
- מידע נוסף על מכסות ומגבלות מערכת זמין במסמכי התיעוד של Cloud Quotas. Google Cloud
- מידע נוסף על שגיאות ב-API זמין במאמר שגיאות ב-API.