יצירת מדיניות לעומסי עבודה עבור קבוצות של מכונות מנוהלות

במאמר הזה מוסבר איך ליצור מדיניות לקבוצות מנוהלות של מכונות (MIG) עם מכונות של Compute Engine מסוג A4X Max,‏ A4X,‏ A4,‏ A3 Ultra,‏ A3 Mega,‏ A3 High (8 GPUs) או H4D. מידע נוסף על הדרישות וההגבלות שחלות כשיוצרים מדיניות לגבי עומסי עבודה זמין במאמר מידע על מדיניות לגבי עומסי עבודה.

מדיניות עומס עבודה מאפשרת לכם לציין את המיקום או הטופולוגיה של המכונות הווירטואליות ב-Compute Engine ב-MIG. לדוגמה, אתם יכולים להשתמש במדיניות של עומסי עבודה כדי למקם מכונות וירטואליות קרוב יותר זו לזו, וכך לצמצם את זמן האחזור ברשת עבור עומסי עבודה של בינה מלאכותית (AI), למידת מכונה (ML) או מחשוב בעל ביצועים גבוהים (HPC).

לפני שמתחילים

  • אם עדיין לא עשיתם את זה, תצטרכו להגדיר אימות. אימות הוא תהליך שבו מאמתים את הזהות שלכם כדי לקבל גישה לממשקי API ולשירותים של Google Cloud . כדי להריץ קוד או דוגמאות מסביבת פיתוח מקומית, אפשר לבצע אימות ל-Compute Engine באחת מהדרכים הבאות:

    צריך לבחור את הכרטיסייה הרלוונטית לאופן שבו תכננתם להשתמש בדוגמאות בדף הזה:

    gcloud

    1. התקינו את ה-CLI של Google Cloud. אחר כך, אתחלו את ה-CLI של Google Cloud באמצעות הפקודה הבאה:

      gcloud init

      אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.

  • הגדרת אזור ותחום כברירת מחדל
  • REST

    כדי להשתמש בסביבת פיתוח מקומית בדוגמאות של API בארכיטקטורת REST שבדף הזה, צריך להשתמש בפרטי הכניסה שאתם נותנים ל-CLI של gcloud.

      התקינו את ה-CLI של Google Cloud.

      אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.

    מידע נוסף מופיע במאמר אימות לשימוש ב-REST במסמכי האימות של Google Cloud .

התפקידים הנדרשים

כדי לקבל את ההרשאות שנדרשות ליצירה ולהחלה של מדיניות עומסי עבודה על קבוצות MIG, צריך לבקש מהאדמין להקצות לכם ב-IAM את התפקיד אדמין מכונות של Compute ‏ (v1) (roles/compute.instanceAdmin.v1) בפרויקט. כדי לקרוא הסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

זהו תפקיד שמוגדר מראש וכולל את ההרשאות שנדרשות ליצירה ולהחלה של מדיניות עומסי עבודה על קבוצות של מכונות מנוהלות (MIG). כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:

ההרשאות הנדרשות

כדי ליצור מדיניות של עומסי עבודה ולהחיל אותה על קבוצות של מכונות מנוהלות, נדרשות ההרשאות הבאות:

  • כדי ליצור מדיניות של עומס עבודה: compute.resourcePolicies.create בפרויקט

יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.

יצירת מדיניות של עומס עבודה

כדי ליצור מדיניות לעומס עבודה, משתמשים באחת מהשיטות הבאות בהתאם לסדרת המכונות שבה משתמשים המופעים של המחשוב ב-MIG:

יצירת מדיניות של עומס עבודה עבור מופעי A4X Max או A4X

אם מחילים מדיניות של עומס עבודה על מכונות A4X Max או על מכונות A4X ב-MIG, צריך לציין ערך של טופולוגיית מאיץ כשיוצרים את המדיניות. הפעולה הזו עוזרת לעומסי העבודה להשיג ביצועים של רשת לא חוסמת בקנה מידה גדול.

כדי ליצור מדיניות של עומס עבודה עבור מופעי A4X Max או A4X, בוחרים באחת מהאפשרויות הבאות:

gcloud

כדי ליצור מדיניות של עומסי עבודה עבור מכונות A4X Max או A4X, משתמשים בפקודה gcloud compute resource-policies create workload-policy עם הדגל --accelerator-topology=1x72:

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --accelerator-topology=1x72 \
    --type=high-throughput \
    --region=REGION

מחליפים את מה שכתוב בשדות הבאים:

  • WORKLOAD_POLICY_NAME: השם של מדיניות עומס העבודה.

  • REGION: האזור שבו רוצים ליצור את מדיניות עומס העבודה. מציינים אזור שבו רוצים ליצור את ה-MIG, ושבו זמין סוג המכונה שרוצים להשתמש בו. כדי לבדוק באילו אזורים זמינים סוגי המכונות A4X Max או A4X, אפשר לעיין באזורים ותחומים זמינים.

REST

כדי ליצור מדיניות של עומס עבודה עבור מופעי A4X Max או A4X, שולחים בקשת POST לשיטה resourcePolicies.insert. בגוף הבקשה, כוללים את השדה acceleratorTopology עם הערך 1x72:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies

{
  "name": "WORKLOAD_POLICY_NAME",
  "workloadPolicy": {
    "acceleratorTopology": "1x72",
    "type": "HIGH_THROUGHPUT"
  }
}

מחליפים את מה שכתוב בשדות הבאים:

  • PROJECT_ID: מזהה הפרויקט שבו רוצים ליצור את מדיניות עומס העבודה.

  • REGION: האזור שבו רוצים ליצור את מדיניות עומס העבודה. מציינים אזור שבו רוצים ליצור את ה-MIG, ושבו זמין סוג המכונה שרוצים להשתמש בו. כדי לבדוק באילו אזורים זמינים סוגי המכונות A4X Max או A4X, אפשר לעיין באזורים ותחומים זמינים.

  • WORKLOAD_POLICY_NAME: השם של מדיניות עומס העבודה.

יצירת מדיניות של עומס עבודה עבור מכונות A4,‏ A3 Ultra,‏ A3 Mega,‏ A3 High (8 GPUs) או H4D

אם רוצים להחיל מדיניות של עומס עבודה על מופעי A4,‏ A3 Ultra,‏ A3 Mega,‏ A3 High (8 GPUs) או H4D ב-MIG, מומלץ לציין ערך מקסימלי של מרחק טופולוגי כשיוצרים את המדיניות. הפעולה הזו עוזרת להבטיח מיקום קרוב יותר בין מופעי המחשוב. עם זאת, ככל שהמיקום שתציינו יהיה קומפקטי יותר, יכול להיות שיהיו פחות משאבים זמינים באזור שבו תרצו ליצור את מכונות המחשוב.

כדי ליצור מדיניות של עומס עבודה עבור מופעים מסוג A4,‏ A3 Ultra,‏ A3 Mega או A3 High (8 GPUs), בוחרים באחת מהאפשרויות הבאות:

gcloud

כדי ליצור מדיניות של עומס עבודה, משתמשים בפקודה gcloud compute resource-policies create workload-policy. כדי להגדיר את המיקום של מופעי מחשוב ב-MIG, כוללים את הדגלים הבאים בפקודה:

  • כדי למקם את מופעי המחשוב קרוב אחד לשני ככל האפשר, כוללים את הדגל --type=high-throughput:

    gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
        --type=high-throughput \
        --region=REGION
    
  • כדי לשלוט עוד יותר במיקום של מכונות וירטואליות, כוללים את הדגלים --max-topology-distance ו---type=high-throughput:

    gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
        --max-topology-distance=TOPOLOGY_DISTANCE \
        --type=high-throughput \
        --region=REGION
    

מחליפים את מה שכתוב בשדות הבאים:

  • WORKLOAD_POLICY_NAME: השם של מדיניות עומס העבודה.

  • REGION: האזור שבו רוצים ליצור את מדיניות עומס העבודה. מציינים אזור שבו רוצים ליצור את ה-MIG, ושבו זמין סוג המכונה שרוצים להשתמש בו. כדי לראות את האזורים שבהם זמינים סוגי מכונות עם GPU, אפשר לעיין במאמר בנושא אזורים ותחומים זמינים.

  • TOPOLOGY_DISTANCE: המרחק המקסימלי בטופולוגיה. מרחק מקסימלי קצר יותר יכול להקטין את הסבירות לזמינות של מכונה וירטואלית. מציינים אחד מהערכים הבאים:

    • כדי להציב מופעים של A4 או H4D באותו אשכול: CLUSTER

    • כדי למקם מופעי A4,‏ A3 Ultra,‏ A3 Mega,‏ A3 High (8 GPUs) או H4D באותו בלוק: BLOCK

    • כדי למקם מופעים של A4,‏ A3 Ultra או H4D באותו תת-בלוק: SUBBLOCK

REST

כדי ליצור מדיניות של עומס עבודה, שולחים בקשת POST אל ה-method‏ resourcePolicies.insert. כדי להגדיר את המרחק בין מכונות וירטואליות ב-MIG, כוללים את השדות הבאים בגוף הבקשה:

  • כדי למקם את מופעי החישוב קרוב זה לזה על בסיס המאמץ המרבי, צריך לכלול את השדה type בגוף הבקשה:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
    
    {
      "name": "WORKLOAD_POLICY_NAME",
      "workloadPolicy": {
        "type": "HIGH_THROUGHPUT"
      }
    }
    
  • כדי לשלוט עוד יותר במיקום של מכונות ה-Compute, צריך לכלול את השדות maxTopologyDistance ו-type בגוף הבקשה:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
    
    {
      "name": "WORKLOAD_POLICY_NAME",
      "workloadPolicy": {
        "maxTopologyDistance": "TOPOLOGY_DISTANCE",
        "type": "HIGH_THROUGHPUT"
      }
    }
    

מחליפים את מה שכתוב בשדות הבאים:

  • PROJECT_ID: מזהה הפרויקט שבו רוצים ליצור את מדיניות עומס העבודה.

  • REGION: האזור שבו רוצים ליצור את מדיניות עומס העבודה. מציינים אזור שבו רוצים ליצור את ה-MIG, ושבו זמין סוג המכונה שרוצים להשתמש בו. כדי לראות את האזורים שבהם זמינים סוגי מכונות עם GPU, אפשר לעיין במאמר בנושא אזורים ותחומים זמינים.

  • WORKLOAD_POLICY_NAME: השם של מדיניות עומס העבודה.

  • TOPOLOGY_DISTANCE: המרחק המקסימלי בטופולוגיה. מרחק מקסימלי קצר יותר יכול להקטין את הסבירות לזמינות של מכונה וירטואלית. מציינים אחד מהערכים הבאים:

    • כדי להציב מופעים של A4 או H4D באותו אשכול: CLUSTER

    • כדי למקם מופעי A4,‏ A3 Ultra,‏ A3 Mega,‏ A3 High (8 GPUs) או H4D באותו בלוק: BLOCK

    • כדי למקם מופעים של A4,‏ A3 Ultra או H4D באותו תת-בלוק: SUBBLOCK

המאמרים הבאים