סיום התמיכה ב-NVIDIA P100

‫NVIDIA P100 GPUs ב- Google Cloud יגיעו לסוף התמיכה (EOS) ב-15 בספטמבר 2026.

מה חשוב לדעת

אחרי 15 בספטמבר 2026, לא תוכלו ליצור משאבים של Google Cloudאו לגשת אליהם אם הם מריצים GPU מסוג NVIDIA P100. הוצאה משימוש הזו משפיעה על משאבים בשירותים הבאים:

  • ‫Compute Engine: מכונות וירטואליות
  • ‫Google Kubernetes Engine‏ (GKE): צמתים
  • ‫Gemini Enterprise Agent Platform: מודלים, משימות ונקודות קצה
  • Cloud Workstations: תחנות עבודה
  • ‫Dataflow: משימות של צינורות עיבוד נתונים
  • ‫Managed Service for Apache Spark: אשכולות וקבוצות של משימות ללא שרת
  • מכונות וירטואליות של למידה עמוקה (Deep Learning) ומופעים של מערכת הפעלה שמותאמת לקונטיינרים

איך סוף התמיכה ישפיע על המשאבים הקיימים שלי

עד 15 בספטמבר 2026, לא תהיה השפעה על המשאבים שלכם שמופעלים באמצעות מעבדים גרפיים (GPU) מסוג NVIDIA P100. עם זאת, הפרויקטים שלכם עלולים להיות בסיכון כי אתם מריצים מודל GPU שמתקרב לסוף התמיכה שלו. מוצרים או תכונות שהגיעו לסוף החיים שלהם לא נתמכים על ידי Google Cloud.

מה צריך לעשות

כדי להעביר את עומסי העבודה למעבדי GPU נתמכים, צריך לבחור דגם חדש של GPU, לבדוק את הזמינות שלו באזורים שלכם ולהעביר את עומסי העבודה.

בחירת דגם GPU

מומלץ לעבור ל-GPU מסוג NVIDIA T4 או L4. כדי לקבוע את מודל ה-GPU המתאים ביותר לעומס העבודה שלכם, כדאי להשוות בין האפשרויות הבאות:

תכונה NVIDIA T4 NVIDIA L4
מתאים במיוחד ל מסקנות חסכוניות, אימון מודלים קטנים של למידת מכונה (ML), ניתוח נתונים ועומסי עבודה מדור קודם. הסקה מ-AI,‏ AI גנרטיבי, סטרימינג של מדיה וגרפיקה עם ביצועים גבוהים. יחידות GPU מסוג L4 מספקות ביצועים טובים פי ארבעה מיחידות GPU מסוג T4.
ארכיטקטורה וזיכרון ארכיטקטורת Turing עם זיכרון GPU‏ GDDR6 בנפח 16 GB. ארכיטקטורת Ada Lovelace עם זיכרון GPU בנפח 24GB GDDR6.
סדרת מכונות לשימוש כללי N1 G2 accelerator-optimized
נתיב ההעברה שדרוג במקום: שינוי ה-VM הקיים כדי לעבור ל-T4 במקום בלי להעביר נתונים. העברת מכונות וירטואליות חדשות: מעבר למכונה וירטואלית חדשה כדי לעבור לסדרת מכונות G2.

רשימה מקיפה והשוואה של כל דגמי ה-GPU זמינות במאמר סוגי מכונות עם GPU.

בדיקת המיקומים הזמינים

כדי לוודא שדגם ה-GPU שבחרתם זמין, צריך לעיין בפרטי המיקום של השירות:

העברת עומסי העבודה

בוחרים באחת מהאפשרויות הבאות למעבר, בהתאם לשירות שבו אתם משתמשים:

עומסי עבודה ב-Compute Engine

בהתאם לסוג המכונה ולדגם ה-GPU שאליהם רוצים לעבור, בוחרים אחת מהשיטות הבאות:

מעבר למכונה וירטואלית חדשה

צריך לעבור למכונה וירטואלית חדשה אם מודל ה-GPU החדש לא נתמך באזור של המכונה הוירטואלית הקיימת, או אם עוברים ל-GPU שפועל במכונה מסוג מכונה שעברה אופטימיזציה למאיץ.

כדי לעבור למכונה וירטואלית חדשה, צריך לבצע את השלבים הבאים:

  1. אם מכונת ה-VM הקיימת שלכם משתמשת בדיסקים מקומיים מסוג SSD שמכילים נתונים שאתם רוצים לשמור, אתם צריכים להעביר את התוכן של הדיסקים האלה לנפח אחסון של Persistent Disk.
  2. יוצרים מכונה וירטואלית חדשה. לדוגמה, כדי ליצור מכונה וירטואלית שפועלת על סוג המכונה G2 ‏ (NVIDIA L4), אפשר לעיין במאמר בנושא יצירת מכונת G2.

  3. העברת נפחי אחסון של דיסק מתמיד מהמכונה הווירטואלית הישנה למכונה הווירטואלית החדשה. כדי לעשות את זה, צריך לנתק את עוצמת הקול של דיסק האחסון המתמיד מהמכונה הווירטואלית הישנה ולהוסיף אותה למכונה הווירטואלית החדשה. אפשר גם להעביר קבצים ממכונה וירטואלית אחת לאחרת.

  4. אופציונלי: מעבירים את הנתונים שנשמרו מכרכים של Persistent Disk בחזרה לדיסק SSD מקומי.

  5. מקצים מחדש כתובות IP סטטיות שהיו משויכות למכונה הווירטואלית המקורית למכונה הווירטואלית החדשה.

  6. התקנת מנהלי התקנים (דרייברים) של GPU במכונה הווירטואלית.

  7. מתקינים את האפליקציות ב-VM החדש.

  8. מוחקים את מכונת ה-VM הישנה.

שינוי מכונה וירטואלית קיימת

אם דגם ה-GPU החדש שאליו רוצים לעבור נתמך באותו אזור, והוא פועל על סוגי המכונות למטרות כלליות N1, אפשר לשנות את המכונה הווירטואלית הקיימת כדי לעבור מ-NVIDIA P100 לדגם ה-GPU החדש.

המסוף

כדי לשנות את סוג ה-GPU במסוף, מבצעים את השלבים הבאים:

  1. מוודאים שיש לכם מספיק מכסה לסוג ה-GPU החדש.
  2. מוודאים שכל האפליקציות הקריטיות הופסקו במכונה הווירטואלית.
  3. נכנסים לדף VM instances במסוף Google Cloud .

    כניסה לדף VM instances

  4. לוחצים על השם של המכונה הווירטואלית שמופעל בה NVIDIA P100 GPU. ייפתח הדף פרטי המכונה הווירטואלית.

  5. לוחצים על הפסקה. אם אין אפשרות עצירה, לוחצים על עוד פעולות > עצירה. בודקים בלוח ההתראות מתי המכונה הווירטואלית נעצרת.

  6. לוחצים על עריכה ומבצעים את השלבים הבאים:

    1. בקטע Machine configuration, בוחרים את משפחת המכונות GPU.
    2. ברשימה סוג ה-GPU, משנים את דגם ה-GPU מ-NVIDIA P100 לדגם ה-GPU החדש.
  7. כדי להחיל את השינויים, לוחצים על שמירה.

  8. כדי להפעיל מחדש את המכונה הווירטואלית, לוחצים על התחלה/המשך.

gcloud

כדי לשנות את סוג ה-GPU באמצעות Google Cloud CLI:

  1. מוודאים שיש לכם מספיק מכסה לסוג ה-GPU החדש.
  2. מוודאים שכל האפליקציות הקריטיות הופסקו במכונה הווירטואלית.
  3. מייצאים את הגדרות ה-VM לקובץ YAML מקומי:

    gcloud compute instances export VM_NAME \
       --destination=config.yaml \
       --zone=ZONE
    
  4. פותחים את קובץ config.yaml המיוצא ומעדכנים את הבלוק guestAccelerators:

    guestAccelerators:
    - acceleratorCount: ACCELERATOR_COUNT
     acceleratorType: https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE

    מוודאים שהערך של scheduling.onHostMaintenance הוא TERMINATE בקטע scheduling:

    scheduling:
     automaticRestart: true
     onHostMaintenance: TERMINATE
  5. מפסיקים את ה-VM.

    gcloud compute instances stop VM_NAME \
       --zone=ZONE
    
  6. מחילים את ההגדרה ששונתה באמצעות הפקודה update-from-file.

    gcloud compute instances update-from-file VM_NAME \
       --source=config.yaml \
       --most-disruptive-allowed-action=RESTART \
       --zone=ZONE
    
  7. מפעילים את ה-VM.

    gcloud compute instances start VM_NAME \
       --zone=ZONE
    

מחליפים את מה שכתוב בשדות הבאים:

  • PROJECT_ID: מזהה הפרויקט.
  • VM_NAME: השם של מופע ה-VM.
  • ZONE: האזור שבו נמצאת המכונה הווירטואלית.
  • ACCELERATOR_COUNT: מספר יחידות ה-GPU שרוצים לצרף.
  • ACCELERATOR_TYPE: דגם ה-GPU (לדוגמה,nvidia-tesla-t4).

REST

כדי לשנות את סוג ה-GPU באמצעות Compute Engine API, מבצעים את השלבים הבאים:

  1. מוודאים שיש לכם מספיק מכסה לסוג ה-GPU החדש.
  2. מוודאים שכל האפליקציות הקריטיות הופסקו במכונה הווירטואלית.
  3. מפסיקים את ה-VM.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  4. מעדכנים את אפשרויות התזמון במכונה הווירטואלית המופסקת כך שהיא תופסק במהלך תחזוקת המארח.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling
    
    {
     "onHostMaintenance": "TERMINATE",
     "automaticRestart": true
    }
    
  5. כדי להוסיף או לשנות את יחידות ה-GPU המצורפות, קוראים ל-setMachineResources.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources
    
    {
     "guestAccelerators": [
       {
         "acceleratorCount": ACCELERATOR_COUNT,
         "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE"
       }
     ]
    }
    
  6. מפעילים את ה-VM.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

    מחליפים את מה שכתוב בשדות הבאים:

    • PROJECT_ID: מזהה הפרויקט.
    • VM_NAME: השם של מופע ה-VM.
    • ZONE: האזור שבו נמצאת המכונה הווירטואלית.
    • ACCELERATOR_COUNT: מספר יחידות ה-GPU שרוצים לצרף.
    • ACCELERATOR_TYPE: דגם ה-GPU (לדוגמה, nvidia-tesla-t4).

עומסי עבודה אחרים Google Cloud

אם עומסי העבודה פועלים בשירותים אחרים מלבד Compute Engine, כמו GKE, ‏ Gemini Enterprise Agent Platform,‏ Cloud Workstations, ‏ Dataflow או Managed Service for Apache Spark, צריך לבצע את הפעולות הבאות:

  1. מעדכנים את ההגדרות כך שיפנו לדגם GPU נתמך.

    • ב-GKE, ב-Gemini Enterprise Agent Platform או ב-Cloud Workstations, צריך לעדכן את תבניות ההגדרות.
    • ב-Dataflow, מעדכנים את מפרטי צינור עיבוד הנתונים.
    • בשירות המנוהל ל-Apache Spark, צריך לעדכן את הגדרות האשכול.

    הוראות להגדרת מעבדים גרפיים לשירות מופיעות במסמכי התיעוד של המוצר עבור השירות הזה.

  2. מפעילים מחדש את המשאבים או יוצרים אותם מחדש.

המאמרים הבאים