קוד שגיאה 429

אם מספר הבקשות חורג מהקיבולת שהוקצתה לעיבוד הבקשות, קוד השגיאה 429 מוחזר. בטבלה הבאה מוצגת הודעת השגיאה שנוצרת על ידי כל סוג של מסגרת מכסות:

מסגרת המכסות הודעה
Pay-as-you-go Resource exhausted, please try again later.
הקצאת משאבים לפי התפוקה שנקבעה Too many requests. Exceeded the Provisioned Throughput.

עם מינוי הקצאת משאבים לפי התפוקה שנקבעה, אתם יכולים לשריין כמות של תפוקה למודלים ספציפיים של AI גנרטיבי. אם אין לכם מינוי הקצאת משאבים לפי התפוקה שנקבעה והמשאבים לא זמינים לאפליקציה שלכם, מוחזר קוד השגיאה 429. למרות שאין לכם קיבולת שמורה, אתם יכולים לנסות לשלוח את הבקשה שוב. עם זאת, הבקשה לא נספרת במסגרת שיעור השגיאות שלכם, כפי שמתואר בהסכם רמת השירות (SLA).

בפרויקטים שבהם נרכשה הקצאת משאבים לפי התפוקה שנקבעה, מערכת Vertex AI מודדת את התפוקה של הפרויקט ושומרת את הכמות שנרכשה לשימוש בפועל בפרויקט.

במצב 'הקצאת משאבים לפי התפוקה שנקבעה' רגילה, אם משתמשים בפחות מהכמות שנרכשה, שגיאות שאחרת היו 429 מוחזרות בתור 5XX ונכללות בשיעור השגיאות של ה-SLA. במקרה של Single Zone Provisioned Throughput (הקצאת משאבים לפי התפוקה שנקבעה באזור יחיד), אם משתמשים בפחות מהכמות שנרכשה, שגיאות שקשורות לקיבולת 429 נחשבות כ5XX אבל לא נספרות בשיעור השגיאות בהסכם ה-SLA. אם חורגים מהכמות שנרכשה, הבקשות הנוספות מטופלות על פי דרישה בתשלום לפי שימוש.

Pay-as-you-go

במסגרת מכסת השימוש בתשלום לפי שימוש, יש לכם את האפשרויות הבאות לפתרון שגיאות 429:

הקצאת משאבים לפי התפוקה שנקבעה

כדי לתקן את השגיאה 429 שנוצרת על ידי הקצאת משאבים לפי התפוקה שנקבעה, צריך לבצע את הפעולות הבאות:

  • משתמשים בדוגמה של התנהגות ברירת המחדל, שבה לא מוגדר כותר בבקשות לחיזוי. חריגות מעל המכסה מטופלות על פי דרישה ומחויבות בתשלום לפי שימוש.
  • הגדלת מספר יחידות ה-GSU במינוי הקצאת משאבים לפי התפוקה שנקבעה.

המאמרים הבאים