יצירת מופע באמצעות מודל שמוגבל להזמנה

במאמר הזה נסביר איך ליצור מכונה עצמאית ב-Compute Engine באמצעות מודל הקצאת המשאבים שמוגבל להזמנה. מודל ההקצאה הזה מאפשר לכם ליצור מכונות וירטואליות מסוג A4X Max,‏ A4X,‏ A4,‏ A3 Ultra,‏ A3 Mega,‏ A3 High עם 8 מעבדי GPU,‏ A3 Edge או H4D על ידי שימוש בקיבולת שהוזמנה מראש.

לשיטות אחרות ליצירת מופעי מחשוב באמצעות מודל הקצאת משאבים שקשור להזמנה, אפשר לעיין במאמר סקירה כללית של אפשרויות הפריסה במסמכי התיעוד של AI Hypercomputer.

לפני שמתחילים

  • אם עדיין לא עשיתם את זה, תצטרכו להגדיר אימות. אימות הוא תהליך שבו מאמתים את הזהות שלכם כדי לקבל גישה לממשקי API ולשירותים של Google Cloud . כדי להריץ קוד או דוגמאות מסביבת פיתוח מקומית, אפשר לבצע אימות ל-Compute Engine באחת מהדרכים הבאות:

    צריך לבחור את הכרטיסייה הרלוונטית לאופן שבו תכננתם להשתמש בדוגמאות בדף הזה:

    המסוף

    כשמשתמשים במסוף Google Cloud כדי לגשת לשירותים ולממשקי ה-API, לא צריך להגדיר אימות. Google Cloud

    gcloud

    1. התקינו את ה-CLI של Google Cloud. אחר כך, אתחלו את ה-CLI של Google Cloud באמצעות הפקודה הבאה:

      gcloud init

      אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.

  • הגדרת אזור ותחום כברירת מחדל
  • REST

    כדי להשתמש בסביבת פיתוח מקומית בדוגמאות של API בארכיטקטורת REST שבדף הזה, צריך להשתמש בפרטי הכניסה שאתם נותנים ל-CLI של gcloud.

      התקינו את ה-CLI של Google Cloud.

      אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.

    מידע נוסף מופיע במאמר אימות לשימוש ב-REST במסמכי האימות של Google Cloud .

התפקידים הנדרשים

כדי לקבל את ההרשאות שנדרשות ליצירת מכונות וירטואליות באמצעות מודל הקצאת המשאבים שמוגבל להזמנה, צריך לבקש מהאדמין להקצות לכם ב-IAM את התפקיד אדמין מכונות של Compute ‏ (v1) (roles/compute.instanceAdmin.v1) בפרויקט. כדי לקרוא הסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

זהו תפקיד שמוגדר מראש וכולל את ההרשאות שנדרשות ליצירת מכונות וירטואליות באמצעות מודל הקצאת המשאבים שמוגבל להזמנה. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:

ההרשאות הנדרשות

כדי ליצור מכונות וירטואליות באמצעות מודל הקצאת המשאבים שמוגבל להזמנה, צריך את ההרשאות הבאות:

  • compute.instances.create בפרויקט
  • כדי להשתמש באימג' בהתאמה אישית ליצירת המכונה הווירטואלית (VM)‏: ‫compute.images.useReadOnly בקובץ אימג'
  • כדי להשתמש ב-snapshot ליצירת המכונה הווירטואלית: ‫compute.snapshots.useReadOnly בקובץ snapshot
  • כדי להשתמש בתבנית של הגדרות מכונה ליצירת המכונה הווירטואלית: compute.instanceTemplates.useReadOnly בתבנית של הגדרות המכונה
  • כדי לציין רשת משנה למכונה הווירטואלית: ‫compute.subnetworks.use בפרויקט או ברשת המשנה שנבחרה
  • כדי לציין כתובת IP סטטית למכונה הווירטואלית: ‫compute.addresses.use בפרויקט
  • כדי להקצות כתובת IP חיצונית למכונה הווירטואלית כשמשתמשים ברשת VPC: ‫compute.subnetworks.useExternalIp בפרויקט או ברשת המשנה שנבחרה
  • כדי להקצות רשת מדור קודם למכונה הווירטואלית: ‫compute.networks.use בפרויקט
  • כדי להקצות כתובת IP חיצונית למכונה הווירטואלית כשמשתמשים ברשת מדור קודם: ‫compute.networks.useExternalIp בפרויקט
  • כדי להגדיר מטא-נתונים של המכונה הווירטואלית: ‫compute.instances.setMetadata בפרויקט
  • כדי להגדיר תגים למכונה הווירטואלית: ‫compute.instances.setTags במכונה הווירטואלית
  • כדי להגדיר תוויות למכונה הווירטואלית: ‫compute.instances.setLabels במכונה הווירטואלית
  • כדי להגדיר חשבון שירות לשימוש של המכונה הווירטואלית: ‫compute.instances.setServiceAccount במכונה הווירטואלית
  • כדי ליצור דיסק חדש למכונה הווירטואלית: ‫compute.disks.create בפרויקט
  • כדי לצרף דיסק קיים במצב קריאה-בלבד או במצב קריאה וכתיבה: ‫compute.disks.use בדיסק
  • כדי לצרף דיסק קיים במצב קריאה-בלבד: ‫compute.disks.useReadOnly בדיסק

יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.

יצירת מופע שמשתמש במודל הקצאת משאבים שקשור להזמנה

כדי ליצור אינסטנס מסוג A4X Max,‏ A4X,‏ A4,‏ A3 Ultra,‏ A3 Mega,‏ A3 High עם 8 יחידות GPU או H4D באמצעות מודל הקצאת משאבים שמוגבל לשמירת מקום, צריך לחכות עד שהשמירה האוטומטית של המקום שרוצים להשתמש בו תגיע לזמן ההתחלה שלה. בנוסף, מכונת החישוב שאתם מתכוונים ליצור צריכה לעמוד בכל הדרישות הבאות:

בדוגמה הבאה נוצרת בקשה למקום שמור לעתיד במצב יומן עבור חמש מכונות A3 Ultra, ולאחר מכן נוצרת מכונת A3 Ultra על ידי שימוש במקום השמור שנוצר אוטומטית עבור הבקשה.

כדי ליצור מכונת חישוב לדוגמה באמצעות מודל הקצאת משאבים שמוגבל לשמירת מקום, בוחרים באחת מהאפשרויות הבאות:

המסוף

  1. יוצרים בקשה לדוגמה לחמש מכונות A3 Ultra ושולחים אותה לבדיקה:

    1. פותחים את הדף Reservations במסוף Google Cloud .

      כניסה לדף Reservations

    2. לוחצים על הכרטיסייה Future reservations.

    3. לוחצים על ‎ Create future reservation‎. ייפתח הדף Create a future reservation.

    4. לוחצים על הכרטיסייה GPUs ואז ברשימה GPU type בוחרים באפשרות NVIDIA H200 141GB. הפעולה הזו מציינת מופע A3 Ultra.

    5. בשדה Total capacity needed, מזינים 5.

    6. בקטע Reservation period, מציינים את שעת ההתחלה ואת משך הזמן של תקופת שמירת המקום.

    7. לוחצים על חיפוש קיבולת ואז בקטע קיבולת זמינה בוחרים אחת מהמכונות הזמינות.

    8. לוחצים על יצירה.

  2. כדי ליצור מכונת A3 Ultra שתשתמש בבקשה לדוגמה לשמירת מקום שנוצרה אוטומטית, צריך לבצע את הפעולות הבאות בזמן ההתחלה של הבקשה:

    1. נכנסים לדף Create an instance במסוף Google Cloud .

      כניסה לדף Create an instance

    2. בשדה Name, מזינים שם למופע של Compute. בדוגמה הזו, מזינים example-instance.

    3. מציינים את האזור והתחום שבהם נמצאת ההזמנה שנוצרה אוטומטית. לצורך הדוגמה הזו, בוחרים באפשרויות us-central1 ו-us-central1-b.

    4. לוחצים על הכרטיסייה GPUs ואז ברשימה GPU type בוחרים באפשרות NVIDIA H200 141GB. הפעולה הזו מציינת מופע A3 Ultra ומגדירה את מודל ההקצאה לReservation-bound.

    5. בתפריט הניווט, לוחצים על מתקדם.

    6. בקטע Reservations, בוחרים באפשרות Choose a reservation ואז לוחצים על Choose a reservation.

    7. בחלונית Choose a reservation:

      1. בוחרים את ההזמנה לדוגמה שנוצרה אוטומטית.

      2. לוחצים על בחירה.

    8. בקטע Provisioning model, מרחיבים את הקטע VM provisioning model advanced settings.

    9. ברשימה On VM termination בוחרים באפשרות Stop (ברירת מחדל) או באפשרות Delete.

    10. לוחצים על יצירה.

gcloud

  1. כדי ליצור בקשה לדוגמה לחמש מכונות A3 Ultra ולשלוח אותה לבדיקה, משתמשים בפקודה gcloud beta compute future-reservations create:

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-setting=local \
        --start-time=2026-03-05T00:00:00Z \
        --end-time=2026-03-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-b
    

    נניח ש Google Cloud מאשר את הבקשה ו-Compute Engine יוצר באופן אוטומטי שמירת מקום ריקה. בזמן תחילת הבקשה, ב-5 במרץ 2026, מערכת Compute Engine מגדילה את מספר המכונות הווירטואליות עם GPU שמוזמנות בהזמנה. אחרי זה תוכלו להשתמש בהזמנה.

  2. כדי ליצור מכונת A3 Ultra שתשתמש בהזמנה לדוגמה שנוצרה אוטומטית, משתמשים בפקודה gcloud compute instances create עם הדגלים הבאים:

    • הדגל של --instance-termination-action.

    • הדגל --provisioning-model מוגדר לערך RESERVATION_BOUND.

    • הדגל של --reservation.

    • הדגל --reservation-affinity מוגדר לערך specific.

    הפקודה דומה לפקודה הבאה. הדרישות המלאות ליצירת מופע A3 Ultra מפורטות במאמר יצירת מופע A3 Ultra או A4.

    gcloud compute instance create example-a3ultra-instance  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-b \
        ...
    

    הפקודה כוללת את הערכים הבאים:

    • TERMINATION_ACTION: האם Compute Engine מפסיק (STOP) או מוחק (DELETE) את המכונה בסוף תקופת השמירה.

    • RESERVATION_URL: כתובת ה-URL של ההזמנה, בפורמט הבא:

      • אם ההזמנה שנוצרה אוטומטית קיימת בפרויקט: example-reservation.

      • אם ההזמנה שנוצרה אוטומטית קיימת בפרויקט אחר: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. כדי ליצור בקשה לדוגמה לחמש מכונות A3 Ultra ולשלוח אותה לבדיקה, שולחים בקשת POST אל ה-method‏ futureReservations.insert של הבטא:

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2026-03-05T00:00:00Z",
        "endTime": "2026-03-19T00:00:00Z"
      }
    }
    

    נניח ש Google Cloud מאשר את הבקשה ו-Compute Engine יוצר באופן אוטומטי שמירת מקום ריקה. בזמן תחילת הבקשה, ב-5 במרץ 2026, מערכת Compute Engine מגדילה את מספר המכונות הווירטואליות עם GPU שמוזמנות בהזמנה. אחרי זה תוכלו להשתמש בהזמנה.

  2. בשעת ההתחלה של הבקשה, כדי ליצור מכונת A3 Ultra שתשתמש בהזמנה לדוגמה שנוצרה אוטומטית, שולחים בקשת POST אל ה-method‏ instances.insert. בגוף הבקשה, כוללים את השדות הבאים:

    • השדה reservationAffinity.consumeReservationType מוגדר ל-SPECIFIC_RESERVATION.

    • השדה reservationAffinity.key מוגדר ל-compute.googleapis.com/reservation-name.

    • השדה reservationAffinity.values מוגדר לכתובת ה-URL של ההזמנה.

    • השדה scheduling.instanceTerminationAction.

    • השדה scheduling.provisioningModel מוגדר ל-RESERVATION_BOUND.

    הבקשה תיראה כך: הדרישות המלאות ליצירת מופע A3 Ultra מפורטות במאמר יצירת מופע A3 Ultra או A4.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g",
        "name": "example-a3ultra-instance",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    גוף הבקשה כולל את הערכים הבאים:

    • RESERVATION_URL: כתובת ה-URL של ההזמנה, בפורמט הבא:

      • אם ההזמנה שנוצרה אוטומטית קיימת בפרויקט: example-reservation.

      • אם ההזמנה שנוצרה אוטומטית קיימת בפרויקט אחר: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION: האם Compute Engine מפסיק (STOP) או מוחק (DELETE) את המכונה בסוף תקופת השמירה.

המאמרים הבאים

נסו בעצמכם

אנחנו ממליצים למשתמשים חדשים ב-Google Cloud ליצור חשבון כדי שיוכלו להעריך את הביצועים של Compute Engine באמצעות תרחישים ממשיים. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300 $להרצה, לבדיקה ולפריסה של עומסי העבודה.

אני רוצה לנסות את Compute Engine בחינם