יצירת מכונת TPU וירטואלית

במאמר הזה נסביר איך ליצור מכונה וירטואלית (VM) של TPU. מכונת TPU VM נקראת גם פרוסת TPU במארח יחיד.

כדי ליצור קבוצה של פרוסות TPU במארח יחיד, אפשר לעיין במאמר בנושא יצירת קבוצת מופעים מנוהלת עם פרוסות TPU במארח יחיד.

לפני שמתחילים

  • אם עדיין לא עשיתם את זה, תצטרכו להגדיר אימות. אימות הוא תהליך שבו מאמתים את הזהות שלכם כדי לקבל גישה לממשקי API ולשירותים של Google Cloud . כדי להריץ קוד או דוגמאות מסביבת פיתוח מקומית, אפשר לבצע אימות ל-Compute Engine באחת מהדרכים הבאות:
    1. התקינו את ה-CLI של Google Cloud. אחר כך, אתחלו את ה-CLI של Google Cloud באמצעות הפקודה הבאה:

      gcloud init

      אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.

    2. הגדרת אזור ותחום כברירת מחדל

דרישות מוקדמות

לפני שיוצרים מופע TPU, צריך לבצע את הפעולות הבאות:

  1. בחירת גרסת ה-TPU: בוחרים את גרסת ה-TPU שמתאימה לעומס העבודה. במאמר גרסאות מומלצות של TPU לפי סוגי עומסי עבודה מפורטת רשימה של גרסאות TPU לפי סוג עומס העבודה.

  2. מוודאים שה-TPU זמין במיקום המועדף: מכשירי TPU זמינים באזורים ספציפיים של Google Cloud Google Cloud. כדי להשתמש בגרסת TPU, צריך לוודא שהיא זמינה באזור המועדף. כאן מפורטת רשימת המיקומים של TPU.

  3. מוודאים שיש בפרויקט מכסת TPU מספקת: אם יוצרים מופע TPU עם מכונות וירטואליות לפי דרישה או מכונות וירטואליות מסוג Spot, צריך לוודא שיש מכסת TPU מספקת באזור שבו רוצים להשתמש. כשיוצרים מכונת TPU שצורכת מכסת TPU שמורה, לא נדרשת מכסת TPU כי המכסה משמשת ליצירת ההזמנה. רשימה של שמות מכסות TPU מופיעה במאמר מכסות TPU. במאמר הצגה וניהול של מכסות מוסבר איך לראות את המכסות.

  4. בחירת אפשרות צריכה של TPU: בוחרים את אפשרות הצריכה שהכי מתאימה לעומס העבודה, למשך הזמן ולצרכים שלכם מבחינת עלויות. רשימת האפשרויות לצריכה לפי גרסאות TPU זמינה במאמר אפשרויות צריכה של TPU.

יצירת מכונת TPU וירטואלית

הפרמטרים שבהם משתמשים כדי ליצור מכונה וירטואלית של TPU תלויים באפשרות הצריכה שבה משתמשים: לפי דרישה, Spot, מוגבלת להזמנה או הפעלה גמישה. מידע נוסף זמין במאמר על מודלים של הקצאת משאבים למכונות וירטואליות.

יצירת מכונת TPU וירטואלית על פי דרישה

כדי ליצור מכונה וירטואלית של TPU על פי דרישה, משתמשים בפקודה gcloud compute instances create:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --maintenance-policy=TERMINATE

מחליפים את ה-placeholders הבאים:

  • TPU_NAME: שם למכונת ה-TPU הווירטואלית.
  • MACHINE_TYPE: סוג המכונה של מכונת ה-TPU הווירטואלית (לדוגמה ct6e-standard-8t).
  • IMAGE_FAMILY: משפחת תמונות מערכת ההפעלה של ה-TPU VM. אם רוצים להתקין גרסה ספציפית של מערכת ההפעלה, משתמשים בדגל --image. מידע נוסף על תמונות של מערכת ההפעלה זמין במאמר תמונות של מערכת ההפעלה.
  • IMAGE_PROJECT: הפרויקט שמכיל את תמונת מערכת ההפעלה. בתמונות TPU, הערך הוא ubuntu-os-accelerator-images.
  • ZONE: האזור של ה-TPU VM (לדוגמה, us-central1-b).

יצירת מכונה וירטואלית של TPU Spot

כדי ליצור מכונת TPU זמנית מסוג Spot, משתמשים בפקודה gcloud compute instances create עם הדגל --provisioning-model=SPOT:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --provisioning-model=SPOT \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE

מחליפים את ה-placeholders הבאים:

  • TPU_NAME: שם למכונת ה-TPU הווירטואלית.
  • MACHINE_TYPE: סוג המכונה של מכונת ה-TPU הווירטואלית (לדוגמה ct6e-standard-8t).
  • IMAGE_FAMILY: משפחת תמונות מערכת ההפעלה של ה-TPU VM. אם רוצים להתקין גרסה ספציפית של מערכת ההפעלה, משתמשים בדגל --image. מידע נוסף על תמונות של מערכת ההפעלה זמין במאמר תמונות של מערכת ההפעלה.
  • IMAGE_PROJECT: הפרויקט שמכיל את תמונת מערכת ההפעלה. בתמונות TPU, הערך הוא ubuntu-os-accelerator-images.
  • ZONE: האזור של ה-TPU VM (לדוגמה, us-central1-b).

יצירת מכונה וירטואלית של TPU באמצעות בקשה לשמירת מקום

כדי ליצור מכונת TPU וירטואלית באמצעות אפשרות הצריכה שמקושרת להזמנה, משתמשים בפקודה gcloud compute instances create עם הדגלים --reservation-affinity=specific ו---reservation:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --provisioning-model=reservation-bound \
    --reservation-affinity=specific \
    --reservation=RESERVATION_NAME \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE

מחליפים את ה-placeholders הבאים:

  • TPU_NAME: שם למכונת ה-TPU הווירטואלית.
  • MACHINE_TYPE: סוג המכונה של מכונת ה-TPU הווירטואלית (לדוגמה ct6e-standard-8t).
  • IMAGE_FAMILY: משפחת תמונות מערכת ההפעלה של ה-TPU VM. אם רוצים להתקין גרסה ספציפית של מערכת ההפעלה, משתמשים בדגל --image. מידע נוסף על תמונות של מערכת ההפעלה זמין במאמר תמונות של מערכת ההפעלה.
  • IMAGE_PROJECT: הפרויקט שמכיל את תמונת מערכת ההפעלה. בתמונות TPU, הערך הוא ubuntu-os-accelerator-images.
  • ZONE: האזור של ה-TPU VM (לדוגמה, us-central1-b).
  • RESERVATION_NAME: השם של ההזמנה.

יצירת מכונת TPU וירטואלית עם הפעלה גמישה

כדי ליצור מכונה וירטואלית של TPU Flex-start, משתמשים בפקודה gcloud compute instances create עם הדגל --provisioning-model=FLEX_START:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --provisioning-model=FLEX_START \
    --max-run-duration=MAX_RUN_DURATION \
    --request-valid-for-duration=VALID_DURATION \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE

מחליפים את ה-placeholders הבאים:

  • TPU_NAME: שם למכונת ה-TPU הווירטואלית.
  • MACHINE_TYPE: סוג המכונה של מכונת ה-TPU הווירטואלית (לדוגמה ct6e-standard-8t).
  • IMAGE_FAMILY: משפחת תמונות מערכת ההפעלה של ה-TPU VM. אם רוצים להתקין גרסה ספציפית של מערכת ההפעלה, משתמשים בדגל --image. מידע נוסף על תמונות של מערכת ההפעלה זמין במאמר תמונות של מערכת ההפעלה.
  • IMAGE_PROJECT: הפרויקט שמכיל את תמונת מערכת ההפעלה. בתמונות TPU, הערך הוא ubuntu-os-accelerator-images.
  • ZONE: האזור של ה-TPU VM (לדוגמה, us-central1-b).
  • MAX_RUN_DURATION: משך ההרצה המקסימלי של מכונת ה-TPU (לדוגמה, 6h).
  • VALID_DURATION: משך הזמן המקסימלי שהבקשה תקפה.

מידע נוסף על יצירת מכונות של Compute Engine זמין במאמר יצירה והפעלה של מכונה של Compute Engine.

מגבלות

  • פעולות במחזור החיים: אי אפשר להפסיק, להתחיל, להמשיך או להשהות מופעי TPU. כדי לשנות הגדרות שדורשות הפעלה מחדש או כדי להפסיק את החיובים, צריך למחוק את המופעים.

  • עדכון פרטי מכונה וירטואלית: אפשר לעדכן את המאפיינים שדורשים רק רענון (REFRESH). אם ההגדרה דורשת הפעלה מחדש (RESTART), צריך ליצור מחדש את המכונה.

המאמרים הבאים