סקירה כללית של הקצאת משאבים לפי התפוקה שנקבעה

בדף הזה מוסבר מהי הקצאת משאבים לפי התפוקה שנקבעה ומתי כדאי להשתמש בה.

מבוא להקצאת משאבים לפי התפוקה שנקבעה

‫הקצאת משאבים לפי התפוקה שנקבעה הוא מינוי בעלות קבועה לתקופה קבועה, שזמין לתקופות שונות ומאפשר להזמין תפוקה למודלים נתמכים של AI גנרטיבי ב-Vertex AI. כדי לשריין את נפח התפוקה, צריך לציין את המודל ואת המיקומים הזמינים שבהם המודל פועל.

מתי כדאי להשתמש בהקצאת משאבים לפי התפוקה שנקבעה

אם אחד מהשיקולים הבאים רלוונטי לתרחיש השימוש שלכם, כדאי להשתמש בתכונה 'הקצאת משאבים לפי התפוקה שנקבעה':

  • אתם מפתחים אפליקציות ייצור של AI גנרטיבי בזמן אמת, כמו צ'אטבוטים וסוכנים.
  • עומסי העבודה הקריטיים שלכם דורשים באופן עקבי תפוקה גבוהה. המדד 'קצב העברת נתונים' תלוי במודל.
  • אתם רוצים לספק חוויה עקבית וצפויה למשתמשים באפליקציות שלכם.
  • אתם רוצים עלויות קבועות של בינה מלאכותית גנרטיבית, ולכן אתם משלמים מחיר קבוע מדי חודש או מדי שבוע, ויש לכם שליטה על חריגות.

הקצאת משאבים לפי התפוקה שנקבעה היא אחת מכמה דרכים לצרוך את המודלים של ה-AI הגנרטיבי. מידע על כל האפשרויות לצריכה זמין במאמר אפשרויות לצריכה.

המאמרים הבאים