מעבדי TPU זמניים שניתנים להפסקה
העלות של TPU מסוג Preemptible נמוכה בהרבה מהעלות של TPU מסוג non-preemptible. שירות Cloud TPU עשוי להפסיק לפני הזמן (לסגור) את יחידות ה-TPU האלה בכל שלב, אם הוא זקוק למשאבי TPU נוספים.
יצירת מכונת TPU וירטואלית שניתן להפסיק את הפעולה שלה
gcloud
$ gcloud compute tpus tpu-vm create demo-tpu \ --zone=europe-west4-a \ --accelerator-type=v3-8 \ --version=tpu-vm-tf-2.17.1-pjrt \ --preemptible
where:
-
demo-tpuהוא שם ל-TPU. -
accelerator-typeהוא סוג ה-TPU. מידע נוסף על סוגי המאיצים הנתמכים לכל גרסת TPU זמין במאמר גרסאות TPU. -
versionהיא גרסת התוכנה של Cloud TPU שרוצים להתקין. -
preemptibleמאפשרת ל-Cloud TPU להפסיק לפני הזמן (preempt) את ה-TPU.
תמחור ומכסת שימוש של TPU זמני
המחיר של Preemptible TPU נמוך משמעותית מהמחיר של TPU רגיל. פרטים נוספים מופיעים בדף התמחור. לא מחויבים על TPU אם מתבצעת הפסקה שלהם בדקה הראשונה אחרי שיוצרים אותם.
המיכסה ל-TPU שניתן להפסיק בפתאומיות בדרך כלל גבוהה יותר, והיא נפרדת מהמיכסה ל-TPU רגילים. אפשר לעיין בדף המכסות.
זיהוי אם בוצעה הפסקה זמנית של TPU
משתמשים בפקודה gcloud הבאה כדי לבדוק אם שירות Cloud TPU ביצע קדימה של ה-TPU:
מציגים את יחידות ה-TPU הזמינות:
gcloud compute tpus tpu-vm list --zone=us-central1-b
בפלט של הפקודה מוצגים הפרטים של יחידות ה-TPU שנוצרו בפרויקט. אם בוצעה קדימה (preemption) של TPU, הסטטוס ישתנה מ-READY ל-PREEMPTED.
לדוגמה:
NAME ZONE ACCELERATOR_TYPE NETWORK_ENDPOINT NETWORK RANGE STATUS demo-tpu us-central1-b v2-8 10.240.1.2:8470 default 10.240.1.0/29 PREEMPTED
תכנון אפליקציית למידת מכונה להרצה ב-TPU עם אפשרות קדימה
כדי לוודא שהאפליקציה עמידה בפני הפעלה מחדש של המכונה הווירטואלית ושל ה-TPU, צריך לשמור נקודות ביקורת של המודל באופן קבוע ולהגדיר את האפליקציה כך שתשחזר את נקודת הביקורת האחרונה בהפעלה מחדש.