אם מספר הבקשות חורג מהקיבולת שהוקצתה לעיבוד הבקשות, מוחזר קוד השגיאה 429. בטבלה הבאה מוצגת הודעת השגיאה שנוצרת על ידי כל סוג של מסגרת מכסות:
| מסגרת המכסות | הודעה |
|---|---|
| Pay-as-you-go | Resource exhausted, please try again later. |
| הקצאת משאבים לפי התפוקה שנקבעה | Too many requests. Exceeded the Provisioned Throughput. |
עם מינוי ל-הקצאת משאבים לפי התפוקה שנקבעה (PT), אתם יכולים לשריין כמות מסוימת של תפוקה למודלים ספציפיים של AI גנרטיבי. אם אין לכם מינוי ל-PT והמשאבים לא זמינים לאפליקציה שלכם, מוחזר קוד השגיאה 429. למרות שאין לכם קיבולת משוריינת, אתם יכולים לנסות לשלוח את הבקשה שוב. עם זאת, הבקשה לא נספרת במסגרת שיעור השגיאות, כפי שמתואר בהסכם רמת השירות (SLA).
בפרויקטים שרכשו PT, פלטפורמת הסוכנים של Gemini Enterprise מודדת את התפוקה של הפרויקט ושומרת את כמות התפוקה שנרכשה לשימוש בפועל בפרויקט.
ב-PT רגיל, אם משתמשים בפחות מהכמות שנרכשה, שגיאות שאחרת היו 429 מוחזרות כ-5XX ונכללות בשיעור השגיאות של ה-SLA. ב-Single Zone PT, אם משתמשים בפחות מהכמות שנרכשה, שגיאות שקשורות לקיבולת 429 נחשבות כ-5XX אבל לא נכללות בשיעור השגיאות של ה-SLA. אם חורגים מהכמות שנרכשה, הבקשות הנוספות מעובדות על פי דרישה בתשלום לפי שימוש.
Pay-as-you-go
במסגרת מכסת השימוש בתשלום לפי שימוש, יש לכם את האפשרויות הבאות לפתרון שגיאות 429:
- אם אפשר, השתמשו בנקודת הקצה הגלובלית במקום בנקודת קצה אזורית.
- כדאי להטמיע אסטרטגיה לביצוע ניסיונות חוזרים באמצעות השהיה מעריכית קטועה לפני ניסיון חוזר (truncated exponential backoff).
- אם המודל שלכם משתמש במכסות, אתם יכולים לשלוח בקשה להגדלת המכסה (QIR). אם המודל שלכם משתמש בתשלום רגיל לפי שימוש, כדאי להחליק את התנועה ולהפחית את העליות הגדולות.
- כדי לקבל רמת שירות עקבית יותר, מומלץ להירשם ל-PT. מידע נוסף זמין במאמר בנושא PT.
פורטוגזית
כדי לתקן את השגיאה 429 שנוצרה על ידי PT, צריך לבצע את הפעולות הבאות:
- משתמשים בדוגמה של התנהגות ברירת מחדל, שבה לא מוגדר כותר בבקשות לחיזוי. חריגות מעל המכסה מעובדות על פי דרישה ומחויבות בתשלום לפי שימוש.
- הגדלת מספר יחידות ה-GSU במינוי PT
המאמרים הבאים
- מידע נוסף על תוכנית Standard pay-as-you-go זמין במאמר בנושא Standard pay-as-you-go.
- מידע נוסף על PT זמין במאמר בנושא הקצאת משאבים לפי התפוקה שנקבעה.
- מידע על מכסות ומגבלות ב-Agent Platform זמין במאמר מכסות ומגבלות ב-Agent Platform.
- מידע נוסף על מכסות ומגבלות מערכת זמין במאמרי העזרה בנושא מכסות ב-Cloud. Google Cloud