ניהול משאבים בתור
משאבים בתור מאפשרים לכם לבקש משאבי Cloud TPU בתור. כשיוצרים בקשה למשאב בתור, הבקשה מתווספת לתור שמנוהל על ידי שירות Cloud TPU. כשהמשאב שביקשתם יהיה זמין, הוא יוקצה לפרויקט Google Cloud שלכם לשימוש מיידי ובלעדי. הוא יישאר מוקצה לפרויקט אלא אם תמחקו אותו או שהוא יידחק. רק מכונות וירטואליות מסוג TPU Spot ו-TPU שניתן להפסיק את השימוש בהן עומדות בדרישות להפסקת השימוש.
אפשר לציין שעת התחלה ושעת סיום אופציונליות בבקשה למשאב שנמצא בתור. שעת ההתחלה מציינת את השעה המוקדמת ביותר שבה אפשר למלא את הבקשה. אם הבקשה לא מולאה עד שעת הסיום שצוינה, תוקף הבקשה יפוג. הבקשה נשארת בתור גם אחרי שתוקפה פג.
בקשות למשאבים שנמצאות בתור יכולות להיות באחד מהסטטוסים הבאים:
-
WAITING_FOR_RESOURCES: הבקשה עברה אימות ראשוני והתווספה לתור. הבקשה תישאר במצב הזה עד שיהיו מספיק משאבים פנויים כדי להתחיל בהקצאה שלה, או עד שמרווח ההקצאה יסתיים. כשהביקוש גבוה, לא ניתן לספק את כל הבקשות באופן מיידי. אם אתם צריכים זמינות מהימנה יותר של TPU, כדאי לרכוש הזמנה. -
PROVISIONING: הבקשה נבחרה מהתור והמשאבים שלה מוקצים. ACTIVE: הבקשה הוקצתה. כשבקשות למשאבים שנמצאות בתור הן במצבACTIVE, אפשר לנהל את המכונות הווירטואליות של TPU כמו שמתואר במאמר ניהול של יחידות TPU.-
FAILED: לא הייתה אפשרות להשלים את הבקשה, או בגלל בעיה בבקשה או בגלל שהמשאבים המבוקשים לא היו זמינים במרווח ההקצאה. הבקשה נשארת בתור עד שהיא נמחקת באופן מפורש. -
SUSPENDING: המשאבים שמשויכים לבקשה נמחקים. -
SUSPENDED: המשאבים שצוינו בבקשה נמחקו. כשבקשה נמצאת במצבSUSPENDED, היא כבר לא עומדת בדרישות להקצאה נוספת.
דרישות מוקדמות
לפני שמריצים את הפקודות במדריך הזה, צריך להתקין את Google Cloud CLI, ליצור Google Cloud פרויקט ולהפעיל את Cloud TPU API. הוראות מפורטות זמינות במאמר הגדרת סביבת Cloud TPU.
אם אתם משתמשים באחת מספריות הלקוח ב-Cloud, אתם צריכים לפעול לפי הוראות ההגדרה לשפה שבה אתם משתמשים:
בקשה למשאב בתור לפי דרישה
למשאבים על פי דרישה לא תהיה עדיפות קודמת, אבל מכסה על פי דרישה לא מבטיחה שיהיו מספיק משאבי Cloud TPU זמינים כדי למלא את הבקשה שלכם. מידע נוסף על משאבים על פי דרישה זמין במאמר בנושא סוגי מכסות.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite
תיאורים של פרמטרים של פקודות
-
queued-resource-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הקצה ל-TPU שנוצר כשמוקצה משאב לבקשה שהוכנסה לתור. -
project: הפרויקט ב- Google Cloud . -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
תיאורים של פרמטרים של פקודות
-
queued-resource-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הקצה ל-TPU שנוצר כשהוקצתה בקשת המשאב בתור. -
project: הפרויקט ב- Google Cloud . -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסה של TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU.
המסוף
נכנסים לדף TPUs במסוף Google Cloud .
לוחצים על יצירת TPU.
בשדה שם, מזינים שם ל-TPU.
בתיבה תחום, בוחרים את התחום שבו רוצים ליצור את ה-TPU.
בתיבה TPU type, בוחרים סוג של מאיץ. סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים לכל גרסת TPU זמין במאמר גרסאות TPU.
בתיבה TPU software version (גרסת התוכנה של ה-TPU), בוחרים גרסת תוכנה. כשיוצרים מכונת TPU וירטואלית ב-Cloud TPU, גרסת התוכנה של ה-TPU מציינת את גרסת זמן הריצה של ה-TPU שמותקנת. מידע נוסף זמין במאמר בנושא גרסאות תוכנה של TPU.
לוחצים על המתג הפעלת הוספה לתור.
נותנים לבקשה שם בשדה Queued resource name.
לוחצים על יצירה כדי ליצור את בקשת המשאבים בתור.
Java
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
בקשה למשאב בתור באמצעות הזמנה
אפשר להשתמש בהזמנה כדי לבקש משאב שנמצא בתור. כדי לרכוש הזמנה, צריך לפנות לצוות ניהול החשבון Google Cloud .
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --reserved
תיאורים של פרמטרים של פקודות
-
queued-resource-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הקצה ל-TPU שנוצר כשהוקצתה בקשת המשאב בתור. -
project: הפרויקט ב- Google Cloud . -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
reserved: משתמשים בדגל הזה כשמבקשים משאבים בתור כחלק מהזמנה של Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
תיאורים של פרמטרים של פקודות
-
queued-resource-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הקצה ל-TPU שנוצר כשמוקצה משאב לבקשה שהוכנסה לתור. -
project: הפרויקט ב- Google Cloud . -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
reserved: משתמשים בדגל הזה כשמבקשים משאבים בתור כחלק מהזמנה של Cloud TPU.
המסוף
נכנסים לדף TPUs במסוף Google Cloud .
לוחצים על יצירת TPU.
בשדה שם, מזינים שם ל-TPU.
בתיבה תחום, בוחרים את התחום שבו רוצים ליצור את ה-TPU.
בתיבה TPU type, בוחרים סוג של מאיץ. סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים לכל גרסת TPU זמין במאמר גרסאות TPU.
בתיבה TPU software version (גרסת התוכנה של ה-TPU), בוחרים גרסת תוכנה. כשיוצרים מכונת TPU וירטואלית ב-Cloud TPU, גרסת התוכנה של ה-TPU מציינת את גרסת זמן הריצה של ה-TPU שמותקנת. מידע נוסף זמין במאמר בנושא גרסאות תוכנה של TPU.
לוחצים על המתג הפעלת הוספה לתור.
נותנים לבקשה שם בשדה Queued resource name.
מרחיבים את הקטע ניהול.
מסמנים את התיבה שימוש בהזמנה קיימת.
לוחצים על יצירה כדי ליצור את בקשת המשאבים בתור.
בקשת משאב בתור של VM במודל Spot מסוג TPU
VM במודל Spot הוא משאב שניתן להפסיק את השימוש בו לפני הזמן ולהקצות אותו לעומס עבודה אחר בכל שלב. המשאבים של מכונות וירטואליות במודל Spot עולים פחות, ויכול להיות שתקבלו גישה למשאבים מוקדם יותר בהשוואה לבקשה של מכונה וירטואלית שלא במודל Spot. מידע נוסף על מכונות וירטואליות מסוג TPU Spot זמין במאמר ניהול מכונות וירטואליות מסוג TPU Spot.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --spot
תיאורים של פרמטרים של פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: מזהה הפרויקט שבו מוקצה המשאב שנמצא בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
spot: דגל בוליאני שמציין שהמשאב בתור הוא מכונה וירטואלית (VM) מסוג Spot.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
תיאורים של פרמטרים של פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: מזהה הפרויקט שבו מוקצה המשאב שנמצא בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
spot: דגל בוליאני שמציין שהמשאב בתור הוא מכונה וירטואלית (VM) מסוג Spot.
המסוף
נכנסים לדף TPUs במסוף Google Cloud .
לוחצים על יצירת TPU.
בשדה שם, מזינים שם ל-TPU.
בתיבה תחום, בוחרים את התחום שבו רוצים ליצור את ה-TPU.
בתיבה TPU type, בוחרים סוג של מאיץ. סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים לכל גרסת TPU זמין במאמר גרסאות TPU.
בתיבה TPU software version (גרסת התוכנה של ה-TPU), בוחרים גרסת תוכנה. כשיוצרים מכונת TPU וירטואלית ב-Cloud TPU, גרסת התוכנה של ה-TPU מציינת את גרסת זמן הריצה של ה-TPU שמותקנת. מידע נוסף זמין במאמר בנושא גרסאות תוכנה של TPU.
לוחצים על המתג הפעלת הוספה לתור.
נותנים לבקשה שם בשדה Queued resource name.
מרחיבים את הקטע ניהול.
מסמנים את תיבת הסימון הפיכת המכונה הווירטואלית הזו ל-TPU Spot VM.
לוחצים על יצירה.
Java
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
בקשה להקצאת משאב בתור לפני או אחרי שעה מסוימת
אפשר לציין שעת התחלה או שעת סיום אופציונליות בבקשה למשאב בתור. שעת ההתחלה או משך ההתחלה מציינים את השעה המוקדמת ביותר שבה אפשר למלא את הבקשה. זמן הסיום או משך הסיום מציינים לכמה זמן הבקשה תקפה. אם בקשה לא מולאה עד שעת הסיום שצוינה או במהלך משך הזמן שצוין, תוקף הבקשה יפוג. אחרי שהתוקף של הבקשה פג, היא נשארת בתור אבל כבר לא כשירה להקצאה.
אפשר גם לציין מרווח הקצאה על ידי הגדרת שעת התחלה או משך זמן, ושעת סיום או משך זמן.
רשימה של פורמטים נתמכים של חותמות זמן ומשך זמינה במאמר בנושא תאריך ושעה.
שליחת בקשה למימוש משאב בתור אחרי פרק זמן מסוים
בבקשה למשאב בתור, אפשר לציין זמן או משך זמן שאחריהם צריך להקצות משאב.
gcloud
הפקודה הבאה מבקשת להקצות TPU מדגם v5p-4096 אחרי השעה 9:00 בבוקר ב-14 בדצמבר 2022.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-4096 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-time 2022-12-14T09:00:00Z
תיאורים של פרמטרים של פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר בנושא גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
valid-after-time: השעה שאחריה המשאב צריך להיות מוקצה. למידע נוסף על פורמטים של משך, אפשר לעיין בנושא Google Cloud CLI topic datetime.
curl
הפקודה הבאה מבקשת להקצות TPU מדגם v5p-4096 אחרי השעה 9:00 בבוקר ב-14 בדצמבר 2022.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-4096', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
תיאורים של פרמטרים של פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
valid-after-time: השעה שאחריה צריך להקצות את המשאב. למידע נוסף על פורמטים של משך, אפשר לעיין בנושא Google Cloud CLI topic datetime.
המסוף
נכנסים לדף TPUs במסוף Google Cloud .
לוחצים על יצירת TPU.
בשדה שם, מזינים שם ל-TPU.
בתיבה תחום, בוחרים את התחום שבו רוצים ליצור את ה-TPU.
בתיבה TPU type, בוחרים סוג של מאיץ. סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים לכל גרסת TPU זמין במאמר גרסאות TPU.
בתיבה TPU software version (גרסת התוכנה של ה-TPU), בוחרים גרסת תוכנה. כשיוצרים מכונת TPU וירטואלית ב-Cloud TPU, גרסת התוכנה של ה-TPU מציינת את גרסת זמן הריצה של ה-TPU שמותקנת. מידע נוסף זמין במאמר בנושא [TPU version of the TPU runtime to install. מידע נוסף זמין במאמר בנושא גרסאות תוכנה של TPU.
לוחצים על המתג הפעלת הוספה לתור.
נותנים לבקשה שם בשדה Queued resource name.
בשדה Start request on, מזינים את השעה שאחריה המשאב צריך להיות מוקצה.
לוחצים על יצירה כדי ליצור את בקשת המשאבים בתור.
בדוגמה הבאה, מתבקשת הקצאה של v5p-32 אחרי שש שעות.
.gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-duration 6h
תיאורים של פרמטרים של פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
valid-after-duration: משך הזמן שלפניו אסור להקצות את ה-TPU. מידע נוסף על פורמטים של משך זמן זמין במאמר בנושא תאריך ושעה ב-Google Cloud CLI
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
תיאורים של פרמטרים של פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
valid-after-duration: משך הזמן שלפניו אסור להקצות את ה-TPU. מידע נוסף על פורמטים של משך זמן זמין במאמר בנושא תאריך ושעה ב-Google Cloud CLI
Java
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
שליחת בקשה למשאב בתור שהתוקף שלו פג אחרי פרק זמן מסוים
בבקשה למשאב שנמצא בתור, אפשר לציין כמה זמן הבקשה תישאר בתוקף. אם הבקשה לא תטופל עד למועד או למשך הזמן שתציינו, התוקף שלה יפוג.
gcloud
הפקודה הבאה מבקשת TPU מדגם v5p-4096. אם הבקשה לא תאושר עד 14 בדצמבר 2022 בשעה 9:00, תוקף הבקשה יפוג.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-4096 \ --runtime-version v2-alpha-tpuv5 \ --valid-until-time 2022-12-14T09:00:00Z
תיאורים של פרמטרים של פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: מזהה הפרויקט שבו מוקצה המשאב שנמצא בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
valid-until-time: השעה שאחריה הבקשה מבוטלת. מידע נוסף על פורמטים של משך זמין במאמר נושא בנושא תאריך ושעה ב-Google Cloud CLI.
curl
הפקודה הבאה מבקשת TPU מדגם v5p-4096. אם הבקשה לא תאושר עד 14 בדצמבר 2022 בשעה 9:00, תוקף הבקשה יפוג.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-4096', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
תיאורים של פרמטרים של פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: מזהה הפרויקט שבו מוקצה המשאב שנמצא בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
valid-until-time: השעה שאחריה הבקשה מבוטלת. מידע נוסף על פורמטים של משך זמן זמין במאמר נושאים בנושא תאריך ושעה ב-Google Cloud CLI.
המסוף
נכנסים לדף TPUs במסוף Google Cloud .
לוחצים על יצירת TPU.
בשדה שם, מזינים שם ל-TPU.
בתיבה תחום, בוחרים את התחום שבו רוצים ליצור את ה-TPU.
בתיבה TPU type, בוחרים סוג של מאיץ. סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים לכל גרסת TPU זמין במאמר גרסאות TPU.
בתיבה TPU software version (גרסת התוכנה של ה-TPU), בוחרים גרסת תוכנה. כשיוצרים מכונת TPU וירטואלית ב-Cloud TPU, גרסת התוכנה של ה-TPU מציינת את גרסת זמן הריצה של ה-TPU שמותקנת. מידע נוסף זמין במאמר בנושא גרסאות תוכנה של TPU.
לוחצים על המתג הפעלת הוספה לתור.
נותנים לבקשה שם בשדה Queued resource name.
בשדה Cancel request on (ביטול הבקשה בתאריך), מזינים את השעה שבה בקשת המשאב שנוספה לתור תפוג אם היא לא תמולא.
לוחצים על יצירה כדי ליצור את בקשת המשאבים בתור.
בדוגמה הבאה מבוקש v5p-32. אם לא תמלאו את הבקשה תוך שש שעות, היא תפוג.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-until-duration 6h
תיאורים של פרמטרים של פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
valid-until-duration: משך הזמן שהבקשה תקפה. מידע נוסף על פורמטים של משך זמן זמין במאמר בנושא תאריך ושעה ב-Google Cloud CLI
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
תיאורים של פרמטרים של פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
valid-until-duration: משך הזמן שהבקשה תקפה. מידע נוסף על פורמטים של משך זמן זמין במאמר בנושא תאריך ושעה ב-Google Cloud CLI
Python
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
שליחת בקשה להקצאת משאב בתור בתוך מרווח זמן מוגדר
אפשר להגדיר את משך הזמן של ההקצאה על ידי ציון של זמן ההתחלה או משך הזמן, וזמן הסיום או משך הזמן.
gcloud
הפקודה הבאה מבקשת ליצור מכונה מסוג v5p-32 תוך 5 שעות ו-30 דקות מהשעה הנוכחית, ולא יאוחר מ-14 בדצמבר 2022 בשעה 9:00 בבוקר.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
תיאורים של דגלי פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: מזהה הפרויקט שבו מוקצה המשאב שנמצא בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר בנושא גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
valid-until-time: השעה שאחריה הבקשה מבוטלת. מידע נוסף על פורמטים של משך זמן זמין במאמר נושאים בנושא תאריך ושעה ב-Google Cloud CLI. -
valid-after-duration: משך הזמן שלפניו אסור להקצות את ה-TPU. מידע נוסף על פורמטים של משך זמן זמין במאמר נושאים בנושא תאריך ושעה ב-Google Cloud CLI.
curl
הפקודה הבאה מבקשת ליצור מכונה מסוג v5p-32 תוך 5 שעות ו-30 דקות מהשעה הנוכחית, ולא יאוחר מ-14 בדצמבר 2022 בשעה 9:00 בבוקר.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
תיאורים של דגלי פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: מזהה הפרויקט שבו מוקצה המשאב שנמצא בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר בנושא גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
valid-until-time: השעה שאחריה הבקשה מבוטלת. מידע נוסף על פורמטים של משך זמן זמין במאמר נושאים בנושא תאריך ושעה ב-Google Cloud CLI. -
valid-until-duration: משך הזמן שהבקשה תקפה. מידע נוסף על פורמטים של משך זמן זמין במאמר נושאים בנושא תאריך ושעה ב-Google Cloud CLI.
המסוף
נכנסים לדף TPUs במסוף Google Cloud .
לוחצים על יצירת TPU.
בשדה שם, מזינים שם ל-TPU.
בתיבה תחום, בוחרים את התחום שבו רוצים ליצור את ה-TPU.
בתיבה TPU type, בוחרים סוג של מאיץ. סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים לכל גרסת TPU זמין במאמר גרסאות TPU.
בתיבה TPU software version (גרסת התוכנה של ה-TPU), בוחרים גרסת תוכנה. כשיוצרים מכונת TPU וירטואלית ב-Cloud TPU, גרסת התוכנה של ה-TPU מציינת את גרסת זמן הריצה של ה-TPU שמותקנת. מידע נוסף זמין במאמר בנושא גרסאות תוכנה של TPU.
לוחצים על המתג הפעלת הוספה לתור.
נותנים לבקשה שם בשדה Queued resource name.
בשדה Start request on, מזינים את השעה שאחריה המשאב צריך להיות מוקצה.
בשדה Cancel request on (ביטול הבקשה בתאריך), מזינים את השעה שבה בקשת המשאב שנוספה לתור תפוג אם היא לא תמולא.
לוחצים על יצירה כדי ליצור את בקשת המשאבים בתור.
בקשת משאב בתור באמצעות סקריפט לטעינה בזמן ההפעלה
אפשר לציין סקריפט שיורץ על משאב בתור אחרי שהוא יוקצה.
gcloud
כשמשתמשים בפקודה gcloud, אפשר להשתמש בדגל --metadata או בדגל --metadata-from-file כדי לציין פקודת סקריפט או קובץ שמכיל את קוד הסקריפט, בהתאמה. בדוגמה הבאה נוצרת בקשה למשאב בתור שתפעיל את הסקריפט startup-script.sh.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --metadata-from-file='startup-script=startup-script.sh'
תיאורים של דגלי פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: מזהה הפרויקט שבו מוקצה המשאב שנמצא בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
validInterval: הזמן שבו הבקשה תקפה. אחרי הזמן הזה הבקשה מבוטלת. מידע נוסף על פורמטים של משך זמן זמין במאמר נושאים בנושא תאריך ושעה ב-Google Cloud CLI. -
metadata-from-file: מציין קובץ שמכיל מטא-נתונים. אם לא מציינים נתיב מלא לקובץ המטא-נתונים, הפקודה מניחה שהוא נמצא בספרייה הנוכחית. בדוגמה הזו, הקובץ מכיל סקריפט לטעינה בזמן ההפעלה שמופעל כשמבצעים הקצאה של המשאב בתור. -
metadata: מציין מטא-נתונים לבקשה. בדוגמה הזו, המטא-נתונים הם פקודה של סקריפט לטעינה בזמן ההפעלה שמופעלת כשמשאב בתור מוקצה.
curl
כשמשתמשים ב-curl, צריך לכלול את קוד הסקריפט בתוכן ה-JSON.
הדוגמה הבאה כוללת סקריפט מוטבע בגוף ה-JSON.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central1-a', node_id: 'your-node-id', node: { accelerator_type: 'v5e-8', runtime_version: 'v2-alpha-tpuv5-lite', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
תיאורים של דגלי פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הגדיר ל-TPU שנוצר בתגובה לבקשה. -
project: מזהה הפרויקט שבו מוקצה המשאב שנמצא בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
validInterval: הזמן שבו הבקשה תקפה. אחרי הזמן הזה הבקשה מבוטלת. מידע נוסף על פורמטים של משך זמן זמין במאמר נושאים בנושא תאריך ושעה ב-Google Cloud CLI. -
metadata-from-file: מציין קובץ שמכיל מטא-נתונים. אם לא מציינים נתיב מלא לקובץ המטא-נתונים, הפקודה מניחה שהוא נמצא בספרייה הנוכחית. בדוגמה הזו, הקובץ מכיל סקריפט לטעינה בזמן ההפעלה שמופעל כשמוקצה משאב בתור. -
metadata: מציין מטא-נתונים לבקשה. בדוגמה הזו, המטא-נתונים הם פקודה של סקריפט לטעינה בזמן ההפעלה שמופעלת כשמשאב בתור מוקצה.
Java
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
בקשה למשאב בתור עם רשת ורשת משנה מוגדרות
בבקשה למשאב בתור, אפשר לציין רשת ורשת משנה שרוצים לחבר אליהן את ה-TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5e-8 \ --runtime-version v2-alpha-tpuv5-lite \ --network network-name \ --subnetwork subnetwork-name
תיאורים של פרמטרים של פקודות
-
queued-resource-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הקצה ל-TPU שנוצר כשהוקצתה בקשת המשאב בתור. -
project: הפרויקט ב- Google Cloud . -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
reserved: משתמשים בדגל הזה כשמבקשים משאבים בתור כחלק מהזמנה של Cloud TPU. -
network: רשת שהמשאב בתור יהיה חלק ממנה. -
subnetwork: רשת משנה שהמשאב בתור יהיה חלק ממנה.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5e-8', 'runtime_version': 'v2-alpha-tpuv5-lite', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
תיאורים של פרמטרים של פקודות
-
queued-resource-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
node-id: המזהה שהמשתמש הקצה ל-TPU שנוצר כשהוקצתה בקשת המשאב בתור. -
project: הפרויקט ב- Google Cloud . -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU. -
accelerator-type: סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים בכל גרסת TPU זמין במאמר גרסאות TPU. -
runtime-version: הגרסה של תוכנת Cloud TPU. -
reserved: משתמשים בדגל הזה כשמבקשים משאבים בתור כחלק מהזמנה של Cloud TPU. -
network: רשת שהמשאב בתור יהיה חלק ממנה. -
subnetwork: רשת משנה שהמשאב בתור יהיה חלק ממנה.
המסוף
נכנסים לדף TPUs במסוף Google Cloud .
לוחצים על יצירת TPU.
בשדה שם, מזינים שם ל-TPU.
בתיבה תחום, בוחרים את התחום שבו רוצים ליצור את ה-TPU.
בתיבה TPU type, בוחרים סוג של מאיץ. סוג המאיץ מציין את הגרסה והגודל של Cloud TPU שרוצים ליצור. מידע נוסף על סוגי המאיצים הנתמכים לכל גרסת TPU זמין במאמר גרסאות TPU.
בתיבה TPU software version (גרסת התוכנה של ה-TPU), בוחרים גרסת תוכנה. כשיוצרים מכונת TPU וירטואלית ב-Cloud TPU, גרסת התוכנה של ה-TPU מציינת את גרסת זמן הריצה של ה-TPU שמותקנת. מידע נוסף זמין במאמר בנושא גרסאות תוכנה של TPU.
לוחצים על המתג הפעלת הוספה לתור.
נותנים לבקשה שם בשדה Queued resource name.
מרחיבים את הקטע Network.
בשדות Network (רשת) ו-Subnetwork (רשת משנה), בוחרים את הרשת ואת רשת המשנה שרוצים להשתמש בהן.
לוחצים על יצירה כדי ליצור את בקשת המשאבים בתור.
Java
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
מחיקת בקשה למשאב שנמצא בתור
כדי למחוק בקשה למשאב בתור ואת ה-TPU שמשויך לבקשה, צריך למחוק את הבקשה למשאב בתור:
gcloud
מעבירים את הדגל --force לפקודה queued-resource delete:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central1-a \ --force \ --async
תיאורים של דגלי פקודות
-
your-queued-resource-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור של Cloud TPU שרוצים למחוק. -
force: מחיקה של מכונת ה-TPU הווירטואלית ושל בקשת המשאב שבהמתנה.
curl
משתמשים בפרמטר השאילתה force=true בבקשת curl:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id?force=true
תיאורים של דגלי פקודות
-
your-queued-resource-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור של Cloud TPU שרוצים למחוק. -
force: מחיקה של מכונת ה-TPU הווירטואלית ושל בקשת המשאב שבהמתנה.
המסוף
נכנסים לדף TPUs במסוף Google Cloud .
לוחצים על הכרטיסייה משאבים בתור.
מסמנים את התיבה לצד בקשת המשאבים שנמצאת בתור.
לוחצים על מחיקה.
Java
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
אם מוחקים את ה-TPU ישירות, צריך גם למחוק את המשאב שנוסף לתור, כמו בדוגמה הבאה. כשמוחקים את ה-TPU, בקשת המשאב שבהמתנה עוברת למצב SUSPENDED, ואז אפשר למחוק אותה.
gcloud
מוחקים את ה-TPU:
$ gcloud compute tpus tpu-vm delete your-node-id \ --project=your-project-id \ --zone=us-central1-a \ --quiet
תיאורים של דגלי פקודות
-
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור של Cloud TPU שרוצים למחוק. -
your-node-id: השם של ה-TPU שרוצים למחוק.
כשמוחקים את ה-TPU, המשאב המשויך בתור עובר למצב SUSPENDING ואז למצב SUSPENDED. כשמשאב בתור נמצא במצב SUSPENDED, אפשר למחוק אותו:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central1-a
תיאורים של דגלי פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור של Cloud TPU שרוצים למחוק.
curl
מוחקים את ה-TPU:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project/locations/us-central1-a/nodes?node_id=your-node-id
תיאורים של דגלי פקודות
-
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור של Cloud TPU שרוצים למחוק. -
your-node-id: השם של ה-TPU שרוצים למחוק.
כשמוחקים את ה-TPU, המשאב המשויך בתור עובר למצב SUSPENDING ואז למצב SUSPENDED. כשמשאב בתור נמצא במצב SUSPENDED, אפשר למחוק אותו:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id
תיאורים של דגלי פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור של Cloud TPU שרוצים למחוק.
המסוף
מחיקת TPU:
נכנסים לדף TPUs במסוף Google Cloud .
מסמנים את תיבת הסימון לצד ה-TPU.
לוחצים על מחיקה.
כשמוחקים את ה-TPU, המשאב המשויך בתור עובר למצב Suspending ואז למצב Suspended. כשמשאב שנמצא בתור הוא במצב Suspended, אפשר למחוק אותו:
- לוחצים על הכרטיסייה משאבים בתור.
- מסמנים את התיבה לצד בקשת המשאבים שנמצאת בתור.
- לוחצים על מחיקה.
Java
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
כשמוחקים את ה-TPU, המשאב המשויך בתור עובר למצב SUSPENDING ואז למצב SUSPENDED. כשמשאב שנמצא בתור הוא במצב SUSPENDED, אפשר למחוק אותו:
Python
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
כשמוחקים את ה-TPU, המשאב המשויך בתור עובר למצב SUSPENDING ואז למצב SUSPENDED. כשמשאב שנמצא בתור הוא במצב SUSPENDED, אפשר למחוק אותו:
אחזור מידע על סטטוס וניתוח ביצועים של בקשת משאב בתור
אחזור המצב ומידע אבחוני על בקשה למשאב שנמצאת בתור:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central1-a
תיאורים של דגלי פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
project: מזהה הפרויקט שבו מוקצה המשאב שנמצא בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id
תיאורים של דגלי פקודות
-
queued-resource-request-id: המזהה שהמשתמש הקצה לבקשת המשאב שנוספה לתור. -
project: מזהה הפרויקט שבו מוקצה המשאב שנמצא בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU.
המסוף
נכנסים לדף TPUs במסוף Google Cloud .
לוחצים על הכרטיסייה משאבים בתור.
לוחצים על השם של בקשת המשאב שנמצאת בתור.
אחרי הקצאת ה-TPU, אפשר גם לראות פרטים על בקשת המשאב שנמצאת בתור. לשם כך, עוברים אל הדף TPUs, מוצאים את ה-TPU ולוחצים על השם של בקשת המשאב המתאימה שנמצאת בתור.
Java
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
אם הבקשה נכשלת, הפלט יכלול מידע על השגיאה. אם הבקשה ממתינה למשאבים, הפלט ייראה כך:
gcloud
name: projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central1-a/queuedResources/your-queued-resource-id runtimeVersion: v2-alpha-tpuv5-lite schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central1-a
המסוף
בשדה סטטוס המשאב בתור מוצג הערך בהמתנה למשאבים.
הצגת רשימה של בקשות למשאבים שנמצאות בתור בפרויקט
כדי לראות את רשימת הבקשות למשאבים שנמצאות בתור בפרויקט:
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central1-a
תיאורים של דגלי פקודות
-
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/your-zone/queuedResources
תיאורים של דגלי פקודות
-
project: הפרויקט ב- Google Cloud שבו מוקצה המשאב בתור. -
zone: האזור שבו אתם מתכננים ליצור את Cloud TPU.
המסוף
נכנסים לדף TPUs במסוף Google Cloud .
לוחצים על הכרטיסייה משאבים בתור.
Java
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
כדי לבצע אימות ב-Cloud TPU, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.