שימוש בהזמנה

אם יש לכם הזמנה של TPU, אתם יכולים להשתמש במשאבים שהזמנתם כדי ליצור יחידות TPU שתואמות למאפיינים של ההזמנה. הפעולה הזו נקראת ניצול של הזמנה. מידע על שימוש בשמירת מקום ב-TPU כשמשתמשים ב-Google Kubernetes Engine‏ (GKE) זמין במאמר שמירת מקום ב-TPU במסמכי GKE.

אופן השימוש בהזמנה תלוי באופן שבו יוצרים את מכונות ה-TPU הווירטואליות. אתם יכולים ליצור מכונות וירטואליות של TPU או קבוצת מופעי מכונה מנוהלים (MIG) עם מעבדי TPU.

שימוש בהזמנה כשיוצרים מכונת TPU וירטואלית

כשיוצרים מכונת TPU וירטואלית, מציינים את ההזמנה לשימוש באמצעות הפרמטרים --reservation-affinity ו---reservation:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --reservation-affinity=specific \
    --reservation=projects/PROJECT_ID/reservations/RESERVATION_NAME \
    --provisioning-model=reservation-bound \
    --maintenance-policy=TERMINATE

מחליפים את ה-placeholders הבאים:

  • TPU_NAME: השם של מכונת ה-TPU הווירטואלית.
  • MACHINE_TYPE: סוג המכונה של ה-TPU VM (לדוגמה, ct6e-standard-8t).
  • IMAGE_FAMILY: משפחת תמונות מערכת ההפעלה של מכונת ה-TPU. אם רוצים להתקין גרסה ספציפית של מערכת ההפעלה, משתמשים בדגל --image. מידע נוסף על תמונות של מערכת ההפעלה זמין במאמר תמונות של מערכת ההפעלה.
  • IMAGE_PROJECT: הפרויקט שמכיל את תמונת מערכת ההפעלה. בתמונות TPU, הערך הוא ubuntu-os-accelerator-images.
  • ZONE: האזור של מכונת ה-TPU (לדוגמה, us-central1-b).
  • PROJECT_ID: מזהה הפרויקט שעבורו בוצעה ההזמנה.
  • RESERVATION_NAME: השם של ההזמנה בפורמט projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME.

שימוש בהזמנה כשיוצרים קבוצת MIG

יש שני סוגים של קבוצות MIG שאפשר ליצור באמצעות מכונות וירטואליות של TPU:

  • קבוצות MIG עם פרוסות של מארח יחיד.
  • קבוצות של מכונות וירטואליות עם פרוסת אירוח מרובה.

שימוש בהזמנה כשיוצרים קבוצת MIG עם פרוסות של מארח יחיד

כדי לצרוך מקום שמור כשיוצרים MIG עם פרוסות של מארח יחיד, צריך לציין את המקום השמור כחלק מתבנית של הגדרות מכונה.

כדי ליצור קבוצת MIG עם פרוסות של מחשב מארח יחיד:

  1. יצירת תבנית של הגדרות מכונה
  2. אופציונלי: יצירת מדיניות לגבי עומס עבודה
  3. יצירת MIG

יצירת תבנית של הגדרות מכונה שצורכת הזמנה

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
     --machine-type=MACHINE_TYPE \
     --maintenance-policy=TERMINATE \
     --instance-termination-action=DELETE \
     --reservation-affinity=specific \
     --provisioning-model=reservation-bound \
     --reservation=RESERVATION_NAME \
     --image-family=IMAGE_FAMILY \
     --image-project=IMAGE_PROJECT

מחליפים את ה-placeholders הבאים:

  • INSTANCE_TEMPLATE_NAME: השם של תבנית של הגדרות מכונה.
  • MACHINE_TYPE: סוג המכונה של ה-TPU VM (לדוגמה, ct6e-standard-8t).
  • RESERVATION_NAME: השם של ההזמנה בפורמט projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME.
  • IMAGE_FAMILY: משפחת תמונות מערכת ההפעלה של מכונת ה-TPU. אם רוצים להתקין גרסה ספציפית של מערכת ההפעלה, משתמשים בדגל --image. מידע נוסף על תמונות של מערכת ההפעלה זמין במאמר תמונות של מערכת ההפעלה.
  • IMAGE_PROJECT: הפרויקט שמכיל את תמונת מערכת ההפעלה. בתמונות TPU, הערך הוא ubuntu-os-accelerator-images.

יצירת ה-MIG

אפשר ליצור קבוצת מופעי מכונה מנוהלים (MIG) אזורית או קבוצת מופעי מכונה מנוהלים (MIG) אזורית.

יצירת קבוצת מופעים מנוהלת (MIG) אזורית
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --template=INSTANCE_TEMPLATE_NAME \
    --zone=ZONE

מחליפים את ה-placeholders הבאים:

  • MIG_NAME: השם של קבוצת ה-MIG.
  • SIZE: מספר מכונות ה-TPU הווירטואליות ב-MIG.
  • INSTANCE_TEMPLATE_NAME: השם של תבנית של הגדרות מכונה.
  • ZONE: האזור שבו רוצים להקצות את ה-MIG.
יצירת קבוצת מופעים מנוהלת (MIG) אזורית
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --template=INSTANCE_TEMPLATE_NAME\
    --region=REGION \
    --target-distribution-shape=any

מחליפים את ה-placeholders הבאים:

  • MIG_NAME: השם של קבוצת ה-MIG.
  • SIZE: מספר מכונות ה-TPU הווירטואליות ב-MIG.
  • INSTANCE_TEMPLATE_NAME: השם של תבנית של הגדרות מכונה.
  • REGION: האזור שבו רוצים להקצות את ה-MIG.

מידע נוסף על האפשרות --target-distribution-shape זמין במאמר הגדרת צורת חלוקה של מכונות וירטואליות בקבוצת MIG אזורית.

שימוש בהזמנה כשיוצרים קטע של MIG עם כמה מארחים

כדי לצרוך מקום שמור כשיוצרים קבוצת MIG עם פרוסת מולטי-מארח, צריך לציין את המקום השמור כחלק מתבנית של הגדרות מכונה.

יצירת תבנית של הגדרות מכונה שצורכת הזמנה

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
     --machine-type=MACHINE_TYPE \
     --maintenance-policy=TERMINATE \
     --instance-termination-action=DELETE \
     --reservation-affinity=specific \
     --provisioning-model=reservation-bound \
     --reservation=RESERVATION_NAME \
     --image-family=IMAGE_FAMILY \
     --image-project=IMAGE_PROJECT

מחליפים את ה-placeholders הבאים:

  • INSTANCE_TEMPLATE_NAME: השם של תבנית של הגדרות מכונה.
  • MACHINE_TYPE: סוג המכונה של ה-TPU VM (לדוגמה, ct6e-standard-8t).
  • RESERVATION_NAME: השם של ההזמנה בפורמט projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME.
  • IMAGE_FAMILY: משפחת תמונות מערכת ההפעלה של מכונת ה-TPU. אם רוצים להתקין גרסה ספציפית של מערכת ההפעלה, משתמשים בדגל --image. מידע נוסף על תמונות של מערכת ההפעלה זמין במאמר תמונות של מערכת ההפעלה.
  • IMAGE_PROJECT: הפרויקט שמכיל את תמונת מערכת ההפעלה. בתמונות TPU, הערך הוא ubuntu-os-accelerator-images.

יצירת מדיניות של עומס עבודה

אתם יכולים לציין מדיניות לעומס עבודה עבור קבוצות ה-MIG. מידע נוסף זמין במאמר בנושא מדיניות עומסי עבודה עבור קבוצות של מכונות מנוהלות (MIG).

gcloud compute resource-policies create workload WORKLOAD_POLICY_NAME \
  --type=high-throughput \
  --accelerator-topology=TOPOLOGY

מחליפים את ה-placeholders הבאים:

  • WORKLOAD_POLICY_NAME: שם למדיניות של עומס העבודה.
  • TOPOLOGY: הטופולוגיה של מכונות ה-TPU הווירטואליות, לדוגמה, 4x4x8. מידע נוסף על הטופולוגיה של כל גרסה של TPU זמין במאמר בנושא גרסאות TPU.

יצירת ה-MIG

אפשר ליצור קבוצת MIG אזורית או אזורית.

יצירת קבוצת מופעים מנוהלת (MIG) אזורית
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --target-size-policy-mode=bulk \
    --default-action-on-vm-failure=do-nothing \
    --template=INSTANCE_TEMPLATE_URL \
    --zone=ZONE \
    --workload-policy=WORKLOAD_POLICY_URL

מחליפים את ה-placeholders הבאים:

  • MIG_NAME: השם של קבוצת ה-MIG.
  • SIZE: מספר מכונות ה-TPU הווירטואליות ב-MIG.
  • INSTANCE_TEMPLATE_URL: כתובת ה-URL של תבנית של הגדרות מכונה שרוצים להשתמש בה כדי ליצור מכונות ב-MIG. כתובת ה-URL יכולה להכיל את המזהה או את השם של תבנית של הגדרות מכונה. מציינים אחד מהערכים הבאים:
    • לתבנית של הגדרות מכונה אזורית: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • בתבנית של הגדרות מכונה גלובלית: INSTANCE_TEMPLATE_ID
  • ZONE: האזור שבו רוצים להקצות את ה-MIG.
  • WORKLOAD_POLICY_URL: כתובת ה-URL של מדיניות העומס שרוצים להשתמש בה כדי ליצור מופעים ב-MIG. לדוגמה: projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME
יצירת קבוצת מופעים מנוהלת (MIG) אזורית
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --target-size-policy-mode=bulk \
    --default-action-on-vm-failure=do-nothing \
    --template=INSTANCE_TEMPLATE_URL \
    --zone=ZONE \
    --target-distribution-shape=any-single-zone \
    --instance-redistribution-type=none \
    --workload-policy=WORKLOAD_POLICY_URL

מחליפים את ה-placeholders הבאים:

  • MIG_NAME: השם של קבוצת ה-MIG.
  • SIZE: מספר מכונות ה-TPU הווירטואליות ב-MIG.
  • INSTANCE_TEMPLATE_URL: כתובת ה-URL של תבנית של הגדרות מכונה שרוצים להשתמש בה כדי ליצור מכונות ב-MIG. כתובת ה-URL יכולה להכיל את המזהה או את השם של תבנית של הגדרות מכונה. מציינים אחד מהערכים הבאים:
    • לתבנית של הגדרות מכונה אזורית: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • בתבנית של הגדרות מכונה גלובלית: INSTANCE_TEMPLATE_ID
  • ZONE: האזור שבו רוצים להקצות את ה-MIG.
  • WORKLOAD_POLICY_URL: כתובת ה-URL של מדיניות העומס שרוצים להשתמש בה כדי ליצור מכונות ב-MIG. לדוגמה: projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME

בדיקת השימוש בהזמנה

אפשר לבדוק את השימוש בהזמנה משותפת רק מפרויקט הבעלים. אם אתם בפרויקט צרכני, אתם צריכים לעבור לפרויקט הבעלים כדי לבדוק את השימוש בהזמנה.

כדי לראות כמה מההזמנה נמצא בשימוש, משתמשים בפקודה gcloud compute reservations describe:

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

מחליפים את משתני הפלייסהולדר הבאים:

  • RESERVATION_NAME: השם של ההזמנה.
  • PROJECT_ID: מזהה הפרויקט שמכיל את ההזמנה.
  • ZONE: האזור שבו קיימת ההזמנה.

כדי לראות את כל ההזמנות בפרויקט, משתמשים בפקודה gcloud compute reservations list:

gcloud compute reservations list --project=PROJECT_ID

מחליפים את משתנה הפלייסהולדר הבא:

  • PROJECT_ID: מזהה הפרויקט.

המאמרים הבאים