NVIDIA P100 GPUs ב- Google Cloud יגיעו לסוף התמיכה (EOS) ב-15 בספטמבר 2026.
מה חשוב לדעת
אחרי 15 בספטמבר 2026, לא תוכלו ליצור משאבים של Google Cloudאו לגשת אליהם אם הם מריצים GPU מסוג NVIDIA P100. הוצאה משימוש הזו משפיעה על משאבים בשירותים הבאים:
- Compute Engine: מכונות וירטואליות
- Google Kubernetes Engine (GKE): צמתים
- Gemini Enterprise Agent Platform: מודלים, משימות ונקודות קצה
- Cloud Workstations: תחנות עבודה
- Dataflow: משימות של צינורות עיבוד נתונים
- Managed Service for Apache Spark: אשכולות וקבוצות של משימות ללא שרת
- מכונות וירטואליות של למידה עמוקה (Deep Learning) ומופעים של מערכת הפעלה שמותאמת לקונטיינרים
איך סוף התמיכה ישפיע על המשאבים הקיימים שלי
עד 15 בספטמבר 2026, לא תהיה השפעה על המשאבים שלכם שמופעלים באמצעות מעבדים גרפיים (GPU) מסוג NVIDIA P100. עם זאת, הפרויקטים שלכם עלולים להיות בסיכון כי אתם מריצים מודל GPU שמתקרב לסוף התמיכה שלו. מוצרים או תכונות שהגיעו לסוף החיים שלהם לא נתמכים על ידי Google Cloud.
מה צריך לעשות
כדי להעביר את עומסי העבודה למעבדי GPU נתמכים, צריך לבחור דגם חדש של GPU, לבדוק את הזמינות שלו באזורים שלכם ולהעביר את עומסי העבודה.
בחירת דגם GPU
מומלץ לעבור ל-GPU מסוג NVIDIA T4 או L4. כדי לקבוע את מודל ה-GPU המתאים ביותר לעומס העבודה שלכם, כדאי להשוות בין האפשרויות הבאות:
| תכונה | NVIDIA T4 | NVIDIA L4 |
|---|---|---|
| מתאים במיוחד ל | מסקנות חסכוניות, אימון מודלים קטנים של למידת מכונה (ML), ניתוח נתונים ועומסי עבודה מדור קודם. | הסקה מ-AI, AI גנרטיבי, סטרימינג של מדיה וגרפיקה עם ביצועים גבוהים. יחידות GPU מסוג L4 מספקות ביצועים טובים פי ארבעה מיחידות GPU מסוג T4. |
| ארכיטקטורה וזיכרון | ארכיטקטורת Turing עם זיכרון GPU GDDR6 בנפח 16 GB. | ארכיטקטורת Ada Lovelace עם זיכרון GPU בנפח 24GB GDDR6. |
| סדרת מכונות | לשימוש כללי N1 | G2 accelerator-optimized |
| נתיב ההעברה | שדרוג במקום: שינוי ה-VM הקיים כדי לעבור ל-T4 במקום בלי להעביר נתונים. | העברת מכונות וירטואליות חדשות: מעבר למכונה וירטואלית חדשה כדי לעבור לסדרת מכונות G2. |
רשימה מקיפה והשוואה של כל דגמי ה-GPU זמינות במאמר סוגי מכונות עם GPU.
בדיקת המיקומים הזמינים
כדי לוודא שדגם ה-GPU שבחרתם זמין, צריך לעיין בפרטי המיקום של השירות:
- Gemini Enterprise Agent Platform: כדאי לעיין במיקומי המאיצים של Gemini Enterprise Agent Platform.
- Cloud Workstations: אפשר לעיין בזמינות של מעבדי GPU ב-Cloud Workstations לפי אזור ותחום.
- לכל השירותים האחרים: כדאי לעיין באזורים ובאזורי זמינות של GPU.
העברת עומסי העבודה
בוחרים באחת מהאפשרויות הבאות למעבר, בהתאם לשירות שבו אתם משתמשים:
עומסי עבודה ב-Compute Engine
בהתאם לסוג המכונה ולדגם ה-GPU שאליהם רוצים לעבור, בוחרים אחת מהשיטות הבאות:
- במכונות וירטואליות מותאמות למאיץ, עוברים למכונה וירטואלית חדשה.
- כדי להשתמש במודל GPU אחר שפועל על מכונה וירטואלית לשימוש כללי מסוג N1, צריך לשנות את המכונה הווירטואלית הקיימת.
מעבר למכונה וירטואלית חדשה
צריך לעבור למכונה וירטואלית חדשה אם מודל ה-GPU החדש לא נתמך באזור של המכונה הוירטואלית הקיימת, או אם עוברים ל-GPU שפועל במכונה מסוג מכונה שעברה אופטימיזציה למאיץ.
כדי לעבור למכונה וירטואלית חדשה, צריך לבצע את השלבים הבאים:
- אם מכונת ה-VM הקיימת שלכם משתמשת בדיסקים מקומיים מסוג SSD שמכילים נתונים שאתם רוצים לשמור, אתם צריכים להעביר את התוכן של הדיסקים האלה לנפח אחסון של Persistent Disk.
יוצרים מכונה וירטואלית חדשה. לדוגמה, כדי ליצור מכונה וירטואלית שפועלת על סוג המכונה G2 (NVIDIA L4), אפשר לעיין במאמר בנושא יצירת מכונת G2.
העברת נפחי אחסון של דיסק מתמיד מהמכונה הווירטואלית הישנה למכונה הווירטואלית החדשה. כדי לעשות את זה, צריך לנתק את עוצמת הקול של דיסק האחסון המתמיד מהמכונה הווירטואלית הישנה ולהוסיף אותה למכונה הווירטואלית החדשה. אפשר גם להעביר קבצים ממכונה וירטואלית אחת לאחרת.
אופציונלי: מעבירים את הנתונים שנשמרו מכרכים של Persistent Disk בחזרה לדיסק SSD מקומי.
מקצים מחדש כתובות IP סטטיות שהיו משויכות למכונה הווירטואלית המקורית למכונה הווירטואלית החדשה.
התקנת מנהלי התקנים (דרייברים) של GPU במכונה הווירטואלית.
מתקינים את האפליקציות ב-VM החדש.
מוחקים את מכונת ה-VM הישנה.
שינוי מכונה וירטואלית קיימת
אם דגם ה-GPU החדש שאליו רוצים לעבור נתמך באותו אזור, והוא פועל על סוגי המכונות למטרות כלליות N1, אפשר לשנות את המכונה הווירטואלית הקיימת כדי לעבור מ-NVIDIA P100 לדגם ה-GPU החדש.
המסוף
כדי לשנות את סוג ה-GPU במסוף, מבצעים את השלבים הבאים:
- מוודאים שיש לכם מספיק מכסה לסוג ה-GPU החדש.
- מוודאים שכל האפליקציות הקריטיות הופסקו במכונה הווירטואלית.
נכנסים לדף VM instances במסוף Google Cloud .
לוחצים על השם של המכונה הווירטואלית שמופעל בה NVIDIA P100 GPU. ייפתח הדף פרטי המכונה הווירטואלית.
לוחצים על הפסקה. אם אין אפשרות עצירה, לוחצים על עוד פעולות > עצירה. בודקים בלוח ההתראות מתי המכונה הווירטואלית נעצרת.
לוחצים על עריכה ומבצעים את השלבים הבאים:
- בקטע Machine configuration, בוחרים את משפחת המכונות GPU.
- ברשימה סוג ה-GPU, משנים את דגם ה-GPU מ-NVIDIA P100 לדגם ה-GPU החדש.
כדי להחיל את השינויים, לוחצים על שמירה.
כדי להפעיל מחדש את המכונה הווירטואלית, לוחצים על התחלה/המשך.
gcloud
כדי לשנות את סוג ה-GPU באמצעות Google Cloud CLI:
- מוודאים שיש לכם מספיק מכסה לסוג ה-GPU החדש.
- מוודאים שכל האפליקציות הקריטיות הופסקו במכונה הווירטואלית.
מייצאים את הגדרות ה-VM לקובץ YAML מקומי:
gcloud compute instances export VM_NAME \ --destination=config.yaml \ --zone=ZONE
פותחים את קובץ
config.yamlהמיוצא ומעדכנים את הבלוקguestAccelerators:guestAccelerators: - acceleratorCount: ACCELERATOR_COUNT acceleratorType: https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE
מוודאים שהערך של
scheduling.onHostMaintenanceהואTERMINATEבקטעscheduling:scheduling: automaticRestart: true onHostMaintenance: TERMINATE
מפסיקים את ה-VM.
gcloud compute instances stop VM_NAME \ --zone=ZONE
מחילים את ההגדרה ששונתה באמצעות הפקודה
update-from-file.gcloud compute instances update-from-file VM_NAME \ --source=config.yaml \ --most-disruptive-allowed-action=RESTART \ --zone=ZONE
מפעילים את ה-VM.
gcloud compute instances start VM_NAME \ --zone=ZONE
מחליפים את מה שכתוב בשדות הבאים:
PROJECT_ID: מזהה הפרויקט.-
VM_NAME: השם של מופע ה-VM. -
ZONE: האזור שבו נמצאת המכונה הווירטואלית. -
ACCELERATOR_COUNT: מספר יחידות ה-GPU שרוצים לצרף. -
ACCELERATOR_TYPE: דגם ה-GPU (לדוגמה,nvidia-tesla-t4).
REST
כדי לשנות את סוג ה-GPU באמצעות Compute Engine API, מבצעים את השלבים הבאים:
- מוודאים שיש לכם מספיק מכסה לסוג ה-GPU החדש.
- מוודאים שכל האפליקציות הקריטיות הופסקו במכונה הווירטואלית.
מפסיקים את ה-VM.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
מעדכנים את אפשרויות התזמון במכונה הווירטואלית המופסקת כך שהיא תופסק במהלך תחזוקת המארח.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling { "onHostMaintenance": "TERMINATE", "automaticRestart": true }כדי להוסיף או לשנות את יחידות ה-GPU המצורפות, קוראים ל-
setMachineResources.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources { "guestAccelerators": [ { "acceleratorCount": ACCELERATOR_COUNT, "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE" } ] }מפעילים את ה-VM.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
מחליפים את מה שכתוב בשדות הבאים:
PROJECT_ID: מזהה הפרויקט.-
VM_NAME: השם של מופע ה-VM. -
ZONE: האזור שבו נמצאת המכונה הווירטואלית. -
ACCELERATOR_COUNT: מספר יחידות ה-GPU שרוצים לצרף. -
ACCELERATOR_TYPE: דגם ה-GPU (לדוגמה,nvidia-tesla-t4).
עומסי עבודה אחרים Google Cloud
אם עומסי העבודה פועלים בשירותים אחרים מלבד Compute Engine, כמו GKE, Gemini Enterprise Agent Platform, Cloud Workstations, Dataflow או Managed Service for Apache Spark, צריך לבצע את הפעולות הבאות:
מעדכנים את ההגדרות כך שיפנו לדגם GPU נתמך.
- ב-GKE, ב-Gemini Enterprise Agent Platform או ב-Cloud Workstations, צריך לעדכן את תבניות ההגדרות.
- ב-Dataflow, מעדכנים את מפרטי צינור עיבוד הנתונים.
- בשירות המנוהל ל-Apache Spark, צריך לעדכן את הגדרות האשכול.
הוראות להגדרת מעבדים גרפיים לשירות מופיעות במסמכי התיעוד של המוצר עבור השירות הזה.
מפעילים מחדש את המשאבים או יוצרים אותם מחדש.