Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

יצירת קבוצת מופעים מנוהלת (MIG) שעברה אופטימיזציה באמצעות AI עם A4X Max

במאמר הזה מוסבר איך ליצור קבוצת מופעי מכונה מנוהלים (MIG) שמשתמשת בסוגי מכונות שעברו אופטימיזציה להאצת A4X Max. במאמר סקירה כללית של אפשרויות הפריסה מוסבר על האפשרויות ליצירת מכונות וקלאסטרים של Compute.

סוג המכונה A4X Max

מכונה של Compute Engine, או מכונת מחשוב, היא משאב מחשוב שמארח בתשתית של Google מכונה וירטואלית (VM) או מכונת Bare Metal. מכונות A4X Max זמינות כמכונות Bare Metal, ששונות ממכונות וירטואליות (VM) בכך שהן מספקות גישה ישירה ולא וירטואלית לחומרה הפיזית הבסיסית. מידע נוסף על סוג המכונה A4X Max זמין במאמר סדרת A4X Max במסמכי Compute Engine.

כדאי ליצור MIG אם רוצים לנהל כמה מופעים של A4X Max כישות אחת. למידע נוסף על קבוצות של מכונות מנוהלות, אפשר לעיין במאמר בנושא קבוצות של מכונות מנוהלות במאמרי העזרה של Compute Engine.

מגבלות

כשמשתמשים בסוגי מכונות A4X Max כדי ליצור MIG, חלות המגבלות הבאות:

אם יוצרים קבוצת MIG אזורית שמשתמשת ברשת RDMA, אפשר ליצור בקבוצת ה-MIG רק מכונות וירטואליות מסוג A4X Max באזור שבו הגדרתם את פרופיל הרשת ל-RDMA.
אי אפשר להגדיר גמישות של מופעים ב-MIG.
אם מחילים מדיניות של עומס עבודה על MIG, אי אפשר לשנות את המדיניות ב-MIG אם הקבוצה כוללת מופעים של A4X Max. כדי לשנות את המדיניות, צריך קודם לשנות את הגודל של ה-MIG לאפס.
אי אפשר להשתמש בתבנית של הגדרות מכונה שמציינת מדיניות מיקום כדי ליצור קבוצת MIG שמשתמשת במדיניות עומס עבודה.

חובה להשתמש במודל ההקצאה reservation-bound. אין תמיכה במודלים אחרים של הקצאת הרשאות.
אי אפשר להשתמש בבקשת שינוי גודל כדי להוסיף מכונות A4X Max ל-MIG. כדי להוסיף את המופעים, צריך להגדיר את גודל היעד של ה-MIG.

לפני שמתחילים

לפני שיוצרים קבוצת מופעים מנוהלת, אם עדיין לא עשיתם זאת, צריך לבצע את השלבים הבאים:

בחירת אפשרות צריכה: האפשרות שתבחרו לצריכה תקבע איך תקבלו גישה למשאבי GPU ואיך תשתמשו בהם. מידע נוסף זמין במאמר בנושא בחירת אפשרות צריכה.
קבלת קיבולת: התהליך לקבלת קיבולת שונה לכל אפשרות צריכה. כדי לקבל מידע על התהליך להשגת קיבולת לאפשרות הצריכה שבחרתם, אפשר לעיין במאמר סקירה כללית על קיבולת.

התפקידים הנדרשים

כדי לקבל את ההרשאות שנדרשות ליצירת קבוצת מופעים מנוהלת (MIG), צריך לבקש מהאדמין להקצות לכם ב-IAM את התפקיד אדמין מכונות של Compute ‏ (v1) (roles/compute.instanceAdmin.v1) בפרויקט. כדי לקרוא הסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

זהו תפקיד שמוגדר מראש וכולל את ההרשאות שנדרשות ליצירת קבוצת מופעים מנוהלת (MIG). כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:

ההרשאות הנדרשות

כדי ליצור קבוצת מופעים מנוהלת (MIG), צריך את ההרשאות הבאות:

כדי ליצור קבוצת MIG: compute.instanceGroupManagers.create בפרויקט

יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.

היסודות של A4X Max

אשכול A4X Max מאורגן בהיררכיה של בלוקים ותתי-בלוקים כדי לאפשר ביצועים של רשתות רחבות היקף ללא חסימה. הבנת הטופולוגיה הזו היא חיונית כשמזמינים קיבולת ומפריסים עומסי עבודה.

מכונת A4X Max: A4X Max instance היא מכונה מסוג A4X Max עם 4 יחידות GPU מצורפות.
Sub-block: יחידת משנה היא היחידה הבסיסית של הקיבולת ב-A4X Max. ב-A4X Max, תת-בלוק מורכב מ-18 מופעים של A4X Max (72 GPUs). המופעים האלה יוצרים דומיין NVLink ומחוברים באמצעות מערכת multi-node NVLink. כדי ליצור תת-בלוק של A4X Max, צריך להחיל מדיניות של עומס עבודה שמציינת טופולוגיה של 1x72.
חסימה: בלוק A4X Max מורכב מ-25 בלוקים משנה (תחומי NVLink), בסך הכול עד 450 מכונות A4X Max (1,800 יחידות GPU). תתי-הבלוקים בארכיטקטורת rail-aligned כדי לאפשר התאמה לעומס יעילה. כל בלוק משנה דורש MIG. לכן, עבור בלוק יחיד של A4X Max, אפשר ליצור 25 קבוצות MIG.

בטבלה הבאה מוצגות אפשרויות הטופולוגיה הנתמכות למופעי A4X Max:

טופולוגיה (`acceleratorTopology`)	מספר יחידות ה-GPU	מספר המופעים
`1x72`	72	18

סקירה כללית

יצירת קבוצת MIG עם סוג המכונה A4X Max כוללת את השלבים הבאים:

יצירת רשתות VPC
יצירת מדיניות של עומס עבודה
יצירת תבנית של הגדרות מכונה
יצירת קבוצת מופעי מכונה מנוהלים (MIG)

יצירת רשתות VPC

הערה: אם אתם מגדירים בדיקה מהירה, אתם יכולים לדלג על השלב הזה ולציין במקום זאת כרטיס רשת יחיד --network-interface=nic-type=IDPF.

כדי להגדיר את הרשת לסוגי המכונות A4X Max, צריך ליצור שתי רשתות VPC לממשקי הרשת הבאים:

רשת VPC רגילה אחת עם שתי רשתות משנה לממשקי הרשת (NIC) של IDPF. הם משמשים לתקשורת בין מארחים.
רשת VPC אחת עם פרופיל רשת RoCE עבור כרטיסי ה-NIC של CX-8 כשיוצרים כמה תתי-בלוקים של A4X Max. רשת ה-VPC של RoCE משתמשת ברשת משנה אחת בשם default-subnet-1-RDMA_NAME_PREFIX-net שמוקצית באופן אוטומטי, וכל שמונת כרטיסי ה-NIC של CX-8 משתמשים ברשת המשנה הזו. כרטיסי ה-NIC האלה משתמשים ב-RDMA over Converged Ethernet ‏ (RoCE), כדי לספק את רוחב הפס הגבוה והתקשורת עם השהייה הנמוכה שנדרשים להרחבת קנה המידה למספר תת-בלוקים של A4X Max. אם יש לכם רק תת-בלוק אחד של A4X Max, אתם יכולים לדלג על השלב הזה של רשת ה-VPC, כי בתוך תת-בלוק יחיד, התקשורת הישירה בין יחידות ה-GPU מטופלת על ידי NVLink מרובה צמתים.

מידע נוסף על סידור כרטיסי רשת זמין במאמר בדיקת רוחב הפס ברשת וסידור כרטיסי הרשת.

אפשר ליצור את הרשתות באופן ידני לפי מדריכי ההוראות, או באופן אוטומטי באמצעות הסקריפט שסופק.

מדריכים להוראה

כדי ליצור את הרשתות, אפשר לפעול לפי ההוראות הבאות:

כדי ליצור רשתות VPC רגילות עבור gVNIC, אפשר לעיין במאמר בנושא יצירה וניהול של רשתות ענן וירטואלי פרטי.
כדי ליצור את רשת ה-VPC של RoCE, אפשר לעיין במאמר בנושא יצירת רשת של ענן וירטואלי פרטי (VPC) עבור כרטיסי רשת של RDMA.

ברשתות VPC האלה, מומלץ להגדיר ערך גדול יותר ליחידת השידור המקסימלית (MTU). עבור סוגי מכונות A4X Max, ה-MTU המומלץ הוא 8896 בייט. כדי לבדוק את הגדרות ה-MTU המומלצות לסוגים אחרים של מכונות GPU, אפשר לעיין במאמר בנושא הגדרות MTU לסוגים של מכונות GPU.

Script

כדי ליצור את הרשתות, פועלים לפי השלבים הבאים.

אפשר להשתמש בסקריפט הבא כדי ליצור רשתות VPC רגילות עבור כרטיסי ה-NIC של IDPF.

  
    #!/bin/bash

    # Create regular VPC network for the IDPF NICs
    gcloud compute networks create IDPF_NETWORK_PREFIX-net \
      --subnet-mode=custom \
      --mtu=8896 \
      --enable-ula-internal-ipv6

    # Create subnets for the IDPF NICs
    for N in $(seq 0 1); do
      gcloud compute networks subnets create IDPF_NETWORK_PREFIX-$N \
        --network=IDPF_NETWORK_PREFIX-net \
        --region=REGION \
        --stack-type=IPV6_ONLY \
        --ipv6-access-type=INTERNAL
    done

    gcloud compute firewall-rules create IDPF_NETWORK_PREFIX-internal \
      --network=IDPF_NETWORK_PREFIX-net \
      --action=ALLOW \
      --rules=tcp:0-65535,udp:0-65535,58 \
      --source-ranges=IP_RANGE

אם אתם צריכים כמה תתי-בלוקים של A4X Max, אתם יכולים להשתמש בסקריפט הבא כדי ליצור את רשת ה-VPC של RoCE ואת רשתות המשנה עבור ארבעת כרטיסי ה-NIC של CX-8 בכל מכונת A4X Max.

חשוב: אם הפריסה שלכם כוללת רק בלוק משנה אחד של A4X Max, אפשר לדלג על השלב הזה.
```
  
    #!/bin/bash

    # List and make sure network profiles exist in the machine type's zone
    gcloud compute network-profiles list --filter "location.name=ZONE"

    # Create network for RDMA NICs
    gcloud compute networks create RDMA_NAME_PREFIX-net \
      --network-profile=ZONE-vpc-roce-metal \
      --subnet-mode custom \
      --mtu=8896

    # For RoCE VPC networks for bare metal instances, a single subnet named
    # default-subnet-1-RDMA_NAME_PREFIX-net is automatically provided.
    # For more details, see https://cloud.google.com/vpc/docs/rdma-network-profiles.

  
```
מחליפים את מה שכתוב בשדות הבאים:
- ‫IDPF_NETWORK_PREFIX: התחילית של השם המותאם אישית שמשמשת לרשתות ולתת-רשתות רגילות של VPC עבור כרטיסי ה-NIC של IDPF.
- ‫RDMA_NAME_PREFIX: תחילית השם המותאמת אישית שבה רוצים להשתמש עבור רשת ה-VPC של RoCE ותת-הרשתות של כרטיסי ה-NIC מסוג CX-8.
- ‫ZONE: מציינים אזור שבו סוג המכונה שרוצים להשתמש בו זמין, למשל us-central1-a. מידע על אזורים זמין במאמר זמינות של GPU לפי אזורים ותחומים.
- ‫REGION: האזור שבו רוצים ליצור את רשתות המשנה. האזור הזה צריך להתאים לאזור שצוין. לדוגמה, אם האזור הוא us-central1-a, האזור הוא us-central1.
- ‫IP_RANGE: טווח כתובות ה-IP שבו ייעשה שימוש עבור כללי חומת האש של SSH.
אופציונלי: כדי לוודא שהמשאבים של רשת ה-VPC נוצרו בהצלחה, בודקים את הגדרות הרשת במסוף Google Cloud :
1. נכנסים לדף VPC networks במסוף Google Cloud .
  מעבר לרשתות VPC
2. מחפשים ברשימה את הרשתות שיצרתם בשלב הקודם.
3. כדי לראות את רשתות המשנה, את כללי חומת האש והגדרות רשת אחרות, לוחצים על שם הרשת.

יצירת מדיניות של עומס עבודה

אם רוצים ליצור מופע יחיד של A4X Max ב-MIG לצורך בדיקה, אפשר לדלג על השלב הזה. אחרת, תצטרכו ליצור מדיניות של עומס עבודה כדי ליצור קבוצת MIG עם מופעים של A4X Max.

כדי ליצור מדיניות לגבי עומסי עבודה, בוחרים באחת מהאפשרויות הבאות:

gcloud

כדי ליצור מדיניות של עומס עבודה, משתמשים בפקודה gcloud compute resource-policies create workload-policy.

כדי להגדיר רשת בין מאיצים, מציינים את הדגל --accelerator-topology בפקודה.

משתמשים בפקודה הבאה עבור סוג המכונה A4X Max. טופולוגיית המאיץ של 1x72 מציינת ש-72 מעבדי GPU מחוברים באמצעות NVLink בתוך בלוק.

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --type=high-throughput \
    --accelerator-topology=1x72 \
    --region=REGION

מחליפים את מה שכתוב בשדות הבאים:

‫WORKLOAD_POLICY_NAME: השם של מדיניות עומסי העבודה.
‫REGION: האזור שבו רוצים ליצור את מדיניות עומס העבודה. מציינים אזור שבו רוצים ליצור את ה-MIG ואת סוג המכונה שרוצים להשתמש בה. מידע על אזורים זמין במאמר זמינות של GPU לפי אזורים ותחומים.

REST

כדי ליצור מדיניות של עומס עבודה, שולחים בקשת POST אל ה-method‏ resourcePolicies.insert.

כדי להגדיר את הרשת בין המאיצים, מציינים את השדה acceleratorTopology בבקשה.

שולחים את הבקשה הבאה לסוג המכונה A4X Max. טופולוגיית המאיץ של 1x72 מציינת ש-72 מעבדי GPU מחוברים באמצעות NVLink בתוך בלוק.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
  {
    "name": "WORKLOAD_POLICY_NAME"
    "workloadPolicy": {
      "type": "HIGH_THROUGHPUT",
      "acceleratorTopology": "1x72"
    }
  }

מחליפים את מה שכתוב בשדות הבאים:

‫PROJECT_ID: מזהה הפרויקט
‫REGION: האזור שבו רוצים ליצור את מדיניות עומס העבודה. מציינים אזור שבו רוצים ליצור את ה-MIG ואת סוג המכונה שרוצים להשתמש בה. מידע על אזורים זמין במאמר זמינות של GPU לפי אזורים ותחומים.
‫WORKLOAD_POLICY_NAME: השם של מדיניות עומסי העבודה.

יצירת תבנית של הגדרות מכונה

כדי להגדיר את מאפייני המכונות ב-MIG, יוצרים תבנית של הגדרות מכונה.

כדי ליצור תבנית של הגדרות מכונה, בוחרים באחת מהאפשרויות הבאות.

הפקודות הבאות מגדירות גם את היקף הגישה של המופעים. כדי לפשט את ניהול ההרשאות, Google ממליצה להגדיר את היקף הגישה במופע לגישת cloud-platform ואז להשתמש בתפקידי IAM כדי להגדיר לאילו שירותים המופע יכול לגשת. מידע נוסף זמין במאמר בנושא שיטות מומלצות לשימוש בהיקפים.

gcloud

כדי ליצור תבנית של הגדרות מכונה אזורית, משתמשים בפקודה gcloud compute instance-templates create.

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --machine-type=a4x-maxgpu-4g-metal \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --instance-template-region=REGION \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=IDPF,network=IDPF_NETWORK_PREFIX-net,stack-type=IPV6_ONLY,subnet=IDPF_NETWORK_PREFIX-sub-0 \
    --network-interface=nic-type=IDPF,network=IDPF_NETWORK_PREFIX-net,stack-type=IPV6_ONLY,subnet=IDPF_NETWORK_PREFIX-sub-1,no-address \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE \
    --restart-on-failure

מחליפים את מה שכתוב בשדות הבאים:

‫INSTANCE_TEMPLATE_NAME: השם של תבנית של הגדרות מכונה.
‫IMAGE_FAMILY: משפחת התמונות של תמונת מערכת ההפעלה שרוצים להשתמש בה. רשימה של מערכות הפעלה נתמכות מופיעה במאמר מערכות הפעלה נתמכות.
‫IMAGE_PROJECT: מזהה הפרויקט של תמונת מערכת ההפעלה.
‫REGION: האזור שבו רוצים ליצור את תבנית של הגדרות מכונה. מציינים אזור שבו זמין סוג המכונה שרוצים להשתמש בו. מידע על אזורים זמין במאמר זמינות של GPU לפי אזורים ותחומים.
‫DISK_SIZE: גודל דיסק האתחול ב-GB.
‫IDPF_NETWORK_PREFIX: קידומת השם שציינתם כשיוצרים את רשתות ה-VPC ותת-הרשתות שמשתמשות בכרטיסי רשת של IDPF.
‫RDMA_NAME_PREFIX: תחילית השם שציינתם כשייצרתם את רשתות ה-VPC ואת תת-הרשתות שמשתמשות בכרטיסי NIC של RDMA.
‫RESERVATION: שם ההזמנה, הבלוק או תת-הבלוק בהזמנה. כדי לראות את שם ההזמנה או את הבלוקים הזמינים, אפשר לעיין במאמר איך רואים את הקיבולת שהוזמנה. בהתאם לדרישות שלכם לגבי מיקום המופע, בוחרים באחת מהאפשרויות הבאות:
- כדי ליצור מופעים של A4X Max בכל בלוק יחיד:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
    
```
- כדי ליצור מופעים של A4X Max בבלוק ספציפי:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
    
```
- כדי ליצור מופעים של A4X Max בתת-בלוק ספציפי:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
    
```
הערה: אם ההזמנה קיימת בפרויקט הנוכחי, אפשר להשמיט את projects/RESERVATION_OWNER_PROJECT_ID/reservations/ מהערך של ההזמנה.

REST

כדי ליצור תבנית של הגדרות מכונה אזורית, שולחים בקשת POST אל ה-method‏ regionInstanceTemplates.insert.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
  "name":"INSTANCE_TEMPLATE_NAME",
  "properties":{
    "machineType":"a4x-maxgpu-4g-metal",
    "disks":[
      {
        "boot":true,
        "initializeParams":{
          "diskSizeGb":"DISK_SIZE",
          "diskType":"hyperdisk-balanced",
          "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
        },
        "mode":"READ_WRITE",
        "type":"PERSISTENT"
      }
    ],
    "serviceAccounts": [
      {
        "email": "default",
        "scopes": [
          "https://www.googleapis.com/auth/cloud-platform"
        ]
      }
    ],
    "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/IDPF_NETWORK_PREFIX-net",
      "nicType": "IDPF",
      "stackType": "IPV6_ONLY",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/IDPF_NETWORK_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/IDPF_NETWORK_PREFIX-net",
      "nicType": "IDPF",
      "stackType": "IPV6_ONLY",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/IDPF_NETWORK_PREFIX-sub-1"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    },
    {
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
      "nicType": "MRDMA",
      "stackType": "IPV6_ONLY"
    }
  ],
    "reservationAffinity":{
        "consumeReservationType":"SPECIFIC_RESERVATION",
        "key":"compute.googleapis.com/reservation-name",
        "values":[
          "RESERVATION"
        ]
      },
    "scheduling":{
        "provisioningModel":"RESERVATION_BOUND",
        "instanceTerminationAction":"DELETE",
        "onHostMaintenance": "TERMINATE",
        "automaticRestart":true
      }
  }
}

מחליפים את מה שכתוב בשדות הבאים:

‫INSTANCE_TEMPLATE_NAME: השם של תבנית של הגדרות מכונה.
‫IMAGE_FAMILY: משפחת התמונות של תמונת מערכת ההפעלה שרוצים להשתמש בה. רשימה של מערכות הפעלה נתמכות מופיעה במאמר מערכות הפעלה נתמכות.
‫IMAGE_PROJECT: מזהה הפרויקט של תמונת מערכת ההפעלה.
‫REGION: האזור שבו רוצים ליצור את תבנית של הגדרות מכונה. מציינים אזור שבו זמין סוג המכונה שרוצים להשתמש בו. מידע על אזורים זמין במאמר זמינות של GPU לפי אזורים ותחומים.
‫DISK_SIZE: גודל דיסק האתחול ב-GB.
‫NETWORK_PROJECT_ID: מזהה הפרויקט של הרשת.
‫IDPF_NETWORK_PREFIX: תחילית השם שציינתם כשייצרתם את רשתות ה-VPC ואת תת-הרשתות שמשתמשות בכרטיסי רשת של IDPF.
‫REGION: האזור של רשת המשנה.
‫RDMA_NAME_PREFIX: תחילית השם שציינתם כשייצרתם את רשתות ה-VPC ואת תת-הרשתות שמשתמשות בכרטיסי NIC של RDMA.
‫RESERVATION: שם ההזמנה, הבלוק או תת-הבלוק בהזמנה. כדי לראות את שם ההזמנה או את הבלוקים הזמינים, אפשר לעיין במאמר איך רואים את הקיבולת שהוזמנה. בהתאם לדרישות שלכם לגבי מיקום המופע, בוחרים באחת מהאפשרויות הבאות:
- כדי ליצור מופעים של A4X Max בכל בלוק יחיד:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
    
```
- כדי ליצור מופעים של A4X Max בבלוק ספציפי:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
    
```
- כדי ליצור מופעים של A4X Max בתת-בלוק ספציפי:
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
    
```
הערה: אם ההזמנה קיימת בפרויקט הנוכחי, אפשר להשמיט את projects/RESERVATION_OWNER_PROJECT_ID/reservations/ מהערך של ההזמנה.

יצירת קבוצת מופעים מנוהלת (MIG)

כשיוצרים קבוצת מופעים מנוהלת (MIG) באמצעות סוג המכונה A4X Max, צריך לציין את מספר המופעים באמצעות גודל היעד של ה-MIG. אפשר להגדיר את גודל היעד במהלך יצירת ה-MIG, כך שיכלול את מספר המופעים הנדרש, או להתחיל עם אפס מופעים ולהגדיל את המספר בהמשך. שימו לב שאי אפשר להשתמש בבקשות לשינוי גודל כדי להוסיף מכונות ל-A4X Max MIG.

כדי לקבל טופולוגיית GPU של 1x72, יוצרים קבוצת MIG עם 18 מכונות A4X Max. כשיוצרים את ה-MIG, מחילים את מדיניות העומס שמציינת את השדה acceleratorTopology. החלת המדיניות מבטיחה ש-Compute Engine ייצור את כל 18 המופעים של A4X Max בתת-בלוק אחד כדי להשתמש בדומיין NVLink. אם אין מספיק קיבולת בתת-בלוק לכל 18 המופעים, כל מופע מנוהל שלא ניתן ליצור באופן מיידי יישאר במצב CREATING עד שתהיה קיבולת זמינה. המכונות המנוהלות האלה מייצגות את מכונות החישוב שקבוצת ה-MIG יוצרת כשיש קיבולת.

כשמחילים מדיניות של עומס עבודה עם השדה acceleratorTopology שמוגדר ל-1x72, אי אפשר ליצור יותר מ-18 מופעים של A4X Max ב-MIG. אם מציינים יותר מ-18 מופעים, יצירת ה-MIG תיכשל. כדי ליצור כמה דומיינים של NVLink, צריך ליצור קבוצת MIG נפרדת לכל דומיין ולהחיל את אותה מדיניות עומס עבודה על כל קבוצת MIG.

כדי ליצור קבוצת מופעים מנוהלת (MIG), בוחרים באחת מהאפשרויות הבאות:

gcloud

כדי ליצור קבוצת MIG עם גודל יעד מוגדר, משתמשים בפקודה instance-groups managed create.

כדי ליצור קבוצת MIG אזורית או אזורית:

כדי ליצור קבוצת MIG אזורית, משתמשים בפקודה הבאה:

gcloud compute instance-groups managed create MIG_NAME \
  --template=INSTANCE_TEMPLATE_URL \
  --size=TARGET_SIZE \
  --workload-policy=WORKLOAD_POLICY_URL \
  --zone=ZONE

כדי ליצור קבוצת MIG אזורית, משתמשים בפקודה הבאה:

gcloud compute instance-groups managed create MIG_NAME \
    --template=INSTANCE_TEMPLATE_URL \
    --size=TARGET_SIZE \
    --workload-policy=WORKLOAD_POLICY_URL \
    --region=REGION

מחליפים את מה שכתוב בשדות הבאים:

‫MIG_NAME: השם של ה-MIG.
‫INSTANCE_TEMPLATE_URL: כתובת ה-URL של תבנית של הגדרות מכונה שרוצים להשתמש בה כדי ליצור מכונות ב-MIG. כתובת ה-URL יכולה להכיל את המזהה או את השם של תבנית של הגדרות מכונה. מציינים אחד מהערכים הבאים:
- לתבנית של הגדרות מכונה אזורית: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- בתבנית של הגדרות מכונה גלובלית: INSTANCE_TEMPLATE_ID
‫TARGET_SIZE: מספר המופעים שרוצים בקבוצת המופעים המנוהלת. בטופולוגיית המאיץ של 1x72, מגדירים את גודל היעד ל-18.
‫WORKLOAD_POLICY_URL: כתובת ה-URL של מדיניות עומס העבודה – לדוגמה, projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy.
‫ZONE: האזור שבו רוצים ליצור את ה-MIG. מציינים אזור בתוך האזור של מדיניות עומס העבודה.
‫REGION: האזור שבו רוצים ליצור את ה-MIG. מציינים את אותו אזור כמו זה של מדיניות עומס העבודה. במקום אזור, אפשר לציין את התחומים באזור מסוים של MIG אזורי באמצעות הדגל --zones.

REST

כדי ליצור קבוצת MIG עם גודל יעד מוגדר, שולחים בקשת POST.

כדי ליצור קבוצת MIG אזורית או אזורית:

כדי ליצור קבוצת MIG אזורית, שולחים בקשת POST אל ה-method‏ instanceGroupManagers.insert.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
{
  "versions": [
    {
      "instanceTemplate": "INSTANCE_TEMPLATE_URL"
    }
  ],
  "name": "MIG_NAME",
  "targetSize": TARGET_SIZE,
  "resourcePolicies": {
    "workloadPolicy": "WORKLOAD_POLICY_URL"
  }
}

כדי ליצור קבוצת MIG אזורית, שולחים בקשת POST אל ה-method‏ regionInstanceGroupManagers.insert.

  POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers
  {
    "name": "MIG_NAME",
    "instanceTemplate": "INSTANCE_TEMPLATE_URL",
    "targetSize": TARGET_SIZE,
    "resourcePolicies": {
      "workloadPolicy": "WORKLOAD_POLICY_URL"
    }
  }

מחליפים את מה שכתוב בשדות הבאים:

‫PROJECT_ID: מזהה הפרויקט.
‫ZONE: האזור שבו רוצים ליצור את קבוצת ה-MIG. מציינים אזור בתוך האזור של מדיניות עומס העבודה.
‫REGION: האזור שבו רוצים ליצור את קבוצת ה-MIG. מציינים את אותו אזור כמו זה של מדיניות עומס העבודה.
‫INSTANCE_TEMPLATE_URL: כתובת ה-URL של תבנית של הגדרות מכונה שרוצים להשתמש בה כדי ליצור מכונות ב-MIG. כתובת ה-URL יכולה להכיל את המזהה או את השם של תבנית של הגדרות מכונה. מציינים אחד מהערכים הבאים:
- לתבנית של הגדרות מכונה אזורית: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- בתבנית של הגדרות מכונה גלובלית: INSTANCE_TEMPLATE_ID
‫MIG_NAME: השם של ה-MIG.
‫TARGET_SIZE: מספר המופעים שרוצים בקבוצת המופעים המנוהלת. בטופולוגיית המאיץ של 1x72, מגדירים את גודל היעד ל-18.
‫WORKLOAD_POLICY_URL: כתובת ה-URL של מדיניות העומס – לדוגמה, projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy.

יצירת קבוצת מופעים מנוהלת (MIG) שעברה אופטימיזציה באמצעות AI עם A4X Max קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

סוג המכונה A4X Max

מגבלות

לפני שמתחילים

התפקידים הנדרשים

ההרשאות הנדרשות

היסודות של A4X Max

סקירה כללית

יצירת רשתות VPC

מדריכים להוראה

Script

יצירת מדיניות של עומס עבודה

gcloud

REST

יצירת תבנית של הגדרות מכונה

gcloud

REST

יצירת קבוצת מופעים מנוהלת (MIG)

gcloud

REST

מה השלב הבא?

יצירת קבוצת מופעים מנוהלת (MIG) שעברה אופטימיזציה באמצעות AI עם A4X Max