מידע על בקשות למקום שמור לעתיד במצב יומן

במסמך הזה מפורטת סקירה כללית של בקשות למקום שמור לעתיד במצב יומן.

אתם יכולים להשתמש בבקשות למקום שמור לעתיד במצב יומן כדי לקבל משאבים שיש להם ביקוש גבוה, למשל כדי ליצור מופעים של מכונות וירטואליות (VM) עם יחידות GPU או TPU מצורפות. כש- Google Cloud מאשר בקשה לשמירת מקום, מערכת Compute Engine מקצה את המשאבים השמורים בתאריך ובשעה שציינתם, למשך עד 90 יום. אחר כך תוכלו להשתמש במשאבים שהוזמנו כדי ליצור מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או מכונות וירטואליות עם TPU, ולהריץ את עומסי העבודה הבאים:

  • משימות אימון מראש של מודלים

  • משימות של כוונון עדין של מודלים

  • עומסי עבודה (workloads) של סימולציות מחשוב עתיר ביצועים (HPC)

  • עלייה צפויה לטווח קצר בעומסי עבודה של הסקת מסקנות

מידע נוסף על דרכים אחרות לשריין משאבים ב-Compute Engine זמין במאמר בחירת סוג שריון.

יצירת בקשה במצב יומן

בקטעים הבאים מוסבר איך לראות את זמינות המשאבים, וגם אילו פרטים צריך לציין כשיוצרים בקשה למקום שמור לעתיד במצב לוח שנה.

הצגת הזמינות העתידית של משאבים

לפני שיוצרים בקשה למקום שמור לעתיד במצב תצוגת יומן, אפשר לראות את הזמינות העתידית באזור של המשאבים הבאים:

  • למכונות וירטואליות של GPU או H4D, עד 60 ימים מראש

  • ל-TPU, עד 120 ימים מראש

‫Compute Engine משתמש בDynamic Workload Scheduler (DWS) כדי לראות מתי המשאבים שביקשתם זמינים. כשיוצרים בקשה, צריך לציין את המספר, הסוג ותקופת ההזמנה של המשאבים שאישרתם שהם זמינים. Google Cloud יש סיכוי גבוה יותר שהבקשה שלכם תאושר אם תספקו את המידע הזה.

הגדרת מאפייני הבקשה

כשיוצרים בקשה לשמירת מקום לעתיד במצב לוח שנה, צריך לציין את המאפיינים הבאים:

  • מחיקה אוטומטית. המאפיין הזה קובע אם Compute Engine ימחק את שמירת המקום שנוצרה אוטומטית (שנוצרה אוטומטית) לבקשה שלכם בשעת הסיום, גם אם לא השתמשתם בכל המשאבים. כדי ליצור בקשה במצב יומן, צריך להפעיל את אפשרות המחיקה האוטומטית.

  • סוג הצריכה. המאפיין הזה מגדיר איך מכונות וירטואליות משתמשות בהזמנה שנוצרה אוטומטית. כשיוצרים בקשה במצב יומן, צריך לציין שרוצים ליצור הזמנות שמטרגטות קהלים ספציפיים. ההגדרה הזו אומרת שרק מכונות וירטואליות שמטרגטות את ההזמנה יכולות להשתמש בה.

  • סוג הפריסה. במאפיין הזה מגדירים את המיקום של המשאבים שהוזמנו. מערכת Compute Engine שומרת משאבים לפי סוג המשאב:

    • כשיוצרים בקשה למכונות וירטואליות עם GPU או H4D, צריך לציין את סוג הפריסה הצפופה (DENSE). ההגדרה הזו מציינת שצריך להקצות משאבים בצורה צפופה כדי להשיג השהיה מינימלית ברשת.

    • ב-TPU, ‏ Compute Engine משתמש בסוג הפריסה הגמיש (FLEXIBLE) כברירת מחדל. ההגדרה הזו מציינת שיש לשריין משאבים כמה שיותר קרוב למועד ההפעלה, על בסיס האפשרות הטובה ביותר.

  • שם. השם של הבקשה, שחייב להיות ייחודי בפרויקט.

  • מספר המשאבים. מספר המכונות הווירטואליות עם יחידות GPU או H4D או יחידות TPU שרוצים לשריין בשעת ההתחלה שצוינה בבקשה.

  • סטטוס התכנון. המאפיין הזה מגדיר אם הבקשה שלכם תישלח מיד אל Google Cloud לבדיקה, או אם היא תישמר כטיוטה ותישלח במועד מאוחר יותר. כשיוצרים בקשה במצב יומן, צריך לציין שהבקשה תישלח לבדיקה באופן מיידי.

  • מצב הזמנה. המאפיין הזה מגדיר את השיטה להזמנת משאבים, וצריך להגדיר אותו ל-CALENDAR עבור בקשה במצב יומן.

  • שם ההזמנה. השם של המקום השמור ש-Compute Engine יוצר באופן אוטומטי אם Google Cloud הבקשה שלכם מאושרת.

  • סוג השיתוף. המאפיין הזה מגדיר אם פרויקטים אחרים בארגון יכולים להשתמש בשמירת המקום שנוצרה אוטומטית לבקשה שאושרה. אפשר לציין אחת מהאפשרויות הבאות:

    • פרויקט יחיד. רק הפרויקט שלכם יכול לצרוך את הקיבולת שהוזמנה.

    • שותף. אפשר לשתף את הקיבולת השמורה עם עד 100 פרויקטים אחרים בארגון. אם תציינו את האפשרות הזו, תצטרכו לציין את הפרויקטים שבהם ישותפו הבקשות שנוצרו אוטומטית. מידע נוסף זמין במאמר בנושא שיטות מומלצות לגבי הזמנות של משאבים משותפים.

  • תקופת ההזמנה. התאריך והשעה שבהם Compute Engine מקצה את הקיבולת שביקשתם, ובהם תוכלו להשתמש בה. תקופת השמירה כוללת את הפעולות הבאות:

    • שעת התחלה. כשרוצים להתחיל להשתמש בקיבולת המוזמנת. בהתאם למשאבים שאתם מזמינים, שעת ההתחלה צריכה להיות לפחות אחד מהערכים הבאים מרגע שאתם יוצרים ושולחים בקשה:

      • למכונות וירטואליות עם GPU ו-H4D‏: 87 שעות (שלושה ימים ו-15 שעות)

      • ב-TPU, שש שעות

    • שעת הסיום. כשהקיבולת שביקשתם כבר לא שמורה לכם. בשלב הזה, מערכת Compute Engine מוחקת את הבקשה שנוצרה אוטומטית, ומפסיקה את הפעילות של מכונות וירטואליות שמשתמשות במשאבים שהוקצו או מוחקת אותן, בהתאם לפעולת הסיום שציינתם עבור המכונות הווירטואליות.

  • מאפייני משאבים. דרישות החומרה של מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או יחידות TPU שרוצים לשריין. מכונות וירטואליות יכולות להשתמש בהזמנה רק אם המאפיינים שלהן תואמים למאפיינים של ההזמנה. מידע נוסף זמין במאמר בנושא הדרישות לשימוש בהזמנות.

  • סוג עומס העבודה. אם אתם משריינים TPU v5e, אתם צריכים לציין איך לשריין קיבולת בהתאם לסוג עומס העבודה:

    • Batch. עומסי עבודה שמטפלים בכמויות גדולות של נתונים בפעולה אחת או בכמה פעולות, כמו עומסי עבודה של אימון ללמידת מכונה (ML).

    • הצגת מודעות. עבור עומסי עבודה שמטפלים בבקשות בו-זמניות ודורשים השהיה מינימלית ברשת, כמו עומסי עבודה של הסקת מסקנות של ML.

  • Zone. האזור שבו רוצים לשמור קיבולת.

תהליך הבקשה לבדיקה

כדי לשריין קיבולת באמצעות בקשה למקום שמור לעתיד במצב יומן, צריך ליצור את הבקשה ולשלוח אותה אל Google Cloud לצורך בדיקה. אחרי שיוצרים בקשה ושולחים אותה, Google Cloud בודק אותה תוך דקה, ואז קורה אחד מהדברים הבאים:

  • Google Cloud מאשר את הבקשה: מערכת Compute Engine שומרת את המשאבים שביקשתם, ובתוך דקה אחרי האישור יוצרת באופן אוטומטי שמירת מקום ריקה. בזמן ההתחלה של הבקשה, Compute Engine מקצה את הקיבולת שביקשתם על ידי הגדלת מספר המכונות הווירטואליות עם GPU, המכונות הווירטואליות מסוג H4D או מעבדי ה-TPU בהזמנה.

  • נתקלים בשגיאה. הבקשה נכשלת כי באזור של הבקשה אין מספיק משאבים. מומלץ לבדוק שוב את הזמינות של המשאבים בעתיד, ואז ליצור ולשלוח בקשה חדשה לבדיקה.

מחזור החיים של בקשה

בתרשים הבא מוצגים המצבים השונים ש-Compute Engine יכול להגדיר לבקשה לשמירת מקום לעתיד במצב יומן:

תרשים זרימה שמציג את המצבים השונים של בקשה למקום שמור לעתיד במצב יומן.

התרשים שלמעלה מציג את המצבים ואת רצף האירועים הבאים:

  • PENDING_APPROVAL: יצרתם בקשה לשליחת ביקורת והגשתם אותה. תוך דקה, Google Cloud מאשר את הבקשה.

  • APPROVED: Google Cloud אישרנו את הבקשה שלך. לאחר מכן, תוך דקה, Compute Engine יוצר באופן אוטומטי שמירת מקום ריקה ומשנה את מצב הבקשה ל-PROCURING.

  • PROCURING: מערכת Compute Engine מתזמנת את הקצאת המשאבים השמורים. לפני שעת ההתחלה של הבקשה, מצב הבקשה משתנה לPROVISIONING.

  • PROVISIONING: מערכת Compute Engine מקצה את המשאבים השמורים על ידי הגדלת מספר מכונות ה-VM עם GPU, מכונות ה-VM מסוג H4D או יחידות ה-TPU ששמורים במקום שנוצר אוטומטית. בשעת ההתחלה של הבקשה, סטטוס הבקשה משתנה לFULFILLED.

  • FULFILLED: מערכת Compute Engine הקצתה את המשאבים השמורים שלכם, ואתם מחויבים עליהם. אתם יכולים להשתמש במקום השמור שנוצר אוטומטית על ידי יצירת מכונות וירטואליות עד שעת הסיום של הבקשה.

בסיום התקופה שצוינה בבקשה, Compute Engine מוחק את הבקשה ואת שמירת המקום שנוצרה אוטומטית. בנוסף, המערכת תפסיק או תמחק מכונות וירטואליות שצורכות את ההזמנה על סמך פעולת הסיום שציינתם עבור המכונות הווירטואליות.

צריכת קיבולת שהוקצתה

אחרי ש- Google Cloud מאשר בקשה למקום שמור לעתיד במצב יומן, מערכת Compute Engine יוצרת באופן אוטומטי מקום שמור עם המאפיינים הבאים:

  • ההזמנה שנוצרה אוטומטית לא כוללת מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או יחידות TPU, ולכן אי אפשר להשתמש בה עדיין.

  • הבקשה שנוצרה אוטומטית מקבלת בירושה את המאפיינים של מכונת ה-VM או ה-TPU שצוינו בבקשה.

בזמן ההתחלה של הבקשה, מערכת Compute Engine מקצה את הקיבולת שביקשתם על ידי הגדלת מספר המכונות הווירטואליות של GPU, המכונות הווירטואליות של H4D או מעבדי ה-TPU בהזמנה שנוצרה אוטומטית. אחרי זה תוכלו להשתמש בהזמנה כדי ליצור מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או מכונות וירטואליות עם TPU שעומדות בכל התנאים הבאים:

אפשר ליצור מכונות וירטואליות עד שההזמנה תנוצל במלואה או עד לשעת הסיום של הבקשה. בסיום התקופה שצוינה בבקשה, מערכת Compute Engine מוחקת את שמירת המקום שנוצרה אוטומטית, ומפסיקה את הפעילות של מכונות וירטואליות שמשתמשות בשמירת המקום או מוחקת אותן.

מכסה

בקשות למקום שמור לעתיד במצב יומן חייבות להשתמש במודל הקצאת משאבים שמוגבל להזמנה. במודל הזה לא נדרשת מכסה ב-Compute Engine כדי לשריין משאבים. עם זאת, לפני שיוצרים בקשה, צריך לוודא שיש לכם מספיק מכסה למשאבים שלא נכללים בהזמנה כשיוצרים מכונות וירטואליות, כמו דיסקים או כתובות IP.

תמחור

כשיוצרים ושולחים בקשה לשריין מקום שמור לעתיד במצב יומן, ואםGoogle Cloud הבקשה מאושרת, לא מחויבים באופן מיידי. במקום זאת, אתם צוברים חיובים כשמתרחש אחד מהמקרים הבאים:

  • Compute Engine מקצה את הקיבולת שביקשתם. כשהבקשה מגיעה למצב FULFILLED בשעת ההתחלה של הבקשה, תחויבו על המשאבים שהוקצו בהתאם לתמחור של DWS. במודל התמחור הזה, המחיר של vCPU, זיכרון, GPU ו-TPU מוזל בהשוואה למחיר הרגיל.

  • אתם משתמשים במשאבים מחוץ להזמנה. כשיוצרים מכונות וירטואליות שמשתמשות בהזמנה שנוצרה אוטומטית, לא חלים חיובים נוספים על המשאבים שנעשה בהם שימוש. אתם מחויבים רק על משאבים שלא כלולים בהזמנה, כמו דיסקים או כתובות IP.

החיוב על המשאבים ששוריינו יפסיק בזמן הסיום של הבקשה. בשלב הזה, המערכת של Compute Engine מוחקת את שמירת המקום שנוצרה אוטומטית, ומפסיקה את הפעילות של מכונות וירטואליות שמשתמשות בשמירת המקום או מוחקת אותן, בהתאם לפעולת הסיום שהוגדרה להן.

מגבלות

בקטעים הבאים מוסבר על המגבלות שחלות על בקשות למקום שמור לעתיד במצב תצוגת לוח שנה.

מגבלות לכל הבקשות

כל הבקשות למקום שמור לעתיד במצב יומן מוגבלות באופן הבא:

  • אפשר לשריין משאבים לתקופה של יום אחד עד 90 ימים.

  • אחרי שיוצרים ושולחים בקשה, אי אפשר לבטל, למחוק או לשנות אותה.

מגבלות על בקשות למכונות וירטואליות

אפשר להזמין מכונות וירטואליות של GPU או מכונות וירטואליות של H4D רק באופן הבא:

  • אפשר לשריין את המספרים הבאים של מכונות וירטואליות בכל בקשה:

    • למכונות וירטואליות עם GPU, בין מכונה וירטואלית אחת ל-80 מכונות וירטואליות

    • למכונות וירטואליות מסוג H4D, בין מכונה וירטואלית אחת ל-256 מכונות וירטואליות

  • אפשר להזמין מראש את סדרות המכונות הבאות:

  • אפשר לשריין מכונות וירטואליות עם GPU רק באזורים ספציפיים. כדי לראות את הזמינות האזורית של H4D, אפשר לעיין באזורים ואזורי זמינות ולהשתמש במסנן סדרת מכונות כדי לראות רק את האזורים שבהם אפשר להזמין מראש מכונות H4D.

  • אי אפשר להשתמש בתבנית של הגדרות מכונה כדי ליצור בקשות למכונות וירטואליות עם GPU או H4D.

מגבלות על בקשות ל-TPU

אפשר לשריין TPU רק בדרכים הבאות:

  • אפשר להזמין 1, 4, 8, 16, 32, 64, 128, 256, 512 או 1,024 שבבי TPU לכל בקשה.

  • אפשר להזמין מראש את הגרסאות הבאות של TPU:

  • אפשר להזמין רק 1, 4 או 8 שבבי TPU v5e להצגת מודעות (SERVING) לסוגי עומסי עבודה.

  • אפשר להזמין TPU רק באזורים הבאים:

    • TPU7x:

      • us-central1-c
    • TPU v6e:

      • asia-northeast1-b

      • europe-west4-a

      • us-east5-a

      • us-east5-b

      • us-south1-ai1b

    • TPU v5p:

      • us-east5-a
    • TPU v5e:

      • לסוגי עומסי עבודה (workload) של עיבוד באצווה (BATCH):

        • europe-west4-b

        • us-west4-b

      • עבור סוגי עומסי עבודה (workload) של הצגת מודעות: (SERVING)

        • us-south1-a

מגבלות לכל ההזמנות שנוצרו אוטומטית

יש מגבלות על בקשות שנוצרות אוטומטית לשמירת מקום:

  • אפשר לשנות את ההזמנה רק באופן הבא:

    • כדי לאפשר או לא לאפשר למשימות של Vertex AI להשתמש בה.

    • אחרי שעת ההתחלה של שמירת המקום.

  • אי אפשר להחיל על ההזמנה הנחות תמורת התחייבות לשימוש (CUD) או הנחות על שימוש קבוע (SUD).

  • אי אפשר למחוק את ההזמנה. מערכת Compute Engine מוחקת אותה בשעת הסיום של ההזמנה.

המאמרים הבאים