RUNNING או ERROR.
הפעלה מחדש של משאב מתמשך מאפשרת לכם להתאושש משגיאות שהמשאב המתמשך לא יכול להתאושש מהן בעצמו. אפשר גם להפעיל מחדש משאב מתמשך כדי לקבל באופן ידני אשכולות עדכניים יותר. בדף הזה מוסבר איך להפעיל מחדש משאב מתמיד באמצעות מסוף Google Cloud ו-API בארכיטקטורת REST.
התפקידים הנדרשים
כדי לקבל את ההרשאה שנדרשת להפעלה מחדש של משאב מתמשך, צריך לבקש מהאדמין להקצות לכם את תפקיד ה-IAM Vertex AI Administrator (roles/aiplatform.admin) בפרויקט.
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
התפקיד המוגדר מראש הזה כולל את ההרשאה aiplatform.persistentResources.update, שנדרשת כדי להפעיל מחדש משאב קבוע.
יכול להיות שתוכלו לקבל את ההרשאה הזו גם בתפקידים בהתאמה אישית או בתפקידים אחרים שמוגדרים מראש.
הפעלה מחדש של משאב מתמשך
בוחרים באחת מהכרטיסיות הבאות כדי לקבל הוראות להפעלה מחדש של משאב מתמשך. מוודאים שאין משימות אימון שפועלות במשאב המתמשך.
המסוף
כדי להפעיל מחדש משאב מתמשך במסוף Google Cloud :
נכנסים לדף Persistent resources במסוף Google Cloud .
לצד השם של המשאב הקבוע שרוצים להפעיל מחדש, לוחצים על סמל האליפסות האנכיות ().
לוחצים על הפעלה מחדש.
לוחצים על אישור.
gcloud
לפני השימוש בנתוני הפקודה הבאים, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט של המשאב הקבוע שרוצים להפעיל מחדש.
- LOCATION: האזור של המשאב הקבוע שרוצים להפעיל מחדש.
- PERSISTENT_RESOURCE_ID: המזהה של המשאב הקבוע שרוצים להפעיל מחדש.
מריצים את הפקודה הבאה:
Linux, macOS או Cloud Shell
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \ --project=PROJECT_ID \ --region=LOCATION
Windows (PowerShell)
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ` --project=PROJECT_ID ` --region=LOCATION
Windows (cmd.exe)
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^ --project=PROJECT_ID ^ --region=LOCATION
אמורים לקבל תגובה שדומה לזו:
Using endpoint [https://us-central1-aiplatform.googleapis.com/] Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent. You may view the status of your persistent resource with the command $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט של המשאב הקבוע שרוצים להפעיל מחדש.
- LOCATION: האזור של המשאב הקבוע שרוצים להפעיל מחדש.
- PERSISTENT_RESOURCE_ID: המזהה של המשאב הקבוע שרוצים להפעיל מחדש.
ה-method של ה-HTTP וכתובת ה-URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot
כדי לשלוח את הבקשה צריך להרחיב אחת מהאפשרויות הבאות:
אתם אמורים לקבל תגובת JSON שדומה לזו:
response:{ "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata", "genericMetadata": { "createTime": "2024-03-18T17:31:54.955004Z", "updateTime": "2024-03-18T17:31:55.204817Z", "state": "RUNNING", "worksOn": [ "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource" ] }, "progressMessage": "Waiting for persistent resource shut down." } }
הפעלה מחדש של משאב מתמשך היא פעולה ארוכת טווח, שבמהלכה אי אפשר למחוק את המשאב המתמשך. הפעולה מכילה שדה progressMessage שאם מתרחשת שגיאה, היא מאכלסת אותו בסטטוס שגיאה. אחרי שהפעולה מציינת "done: true", בודקים את הסטטוס של המשאב הקבוע. אם המשאב המתמשך נמצא במצב RUNNING, ההפעלה מחדש בוצעה בהצלחה והוא מוכן להרצת משימות אימון.
מגבלות
אלה המגבלות להפעלה מחדש של משאב מתמשך:
- במקרים מסוימים, יכול להיות שתאבדו את הקיבולת של משאבים נדירים כשמפעילים מחדש משאב מתמשך. אין ערובה לשמירה מלאה של המשאבים.
- הפעלה מחדש לא זמינה ב-Ray ב-Vertex AI.
- משאבים קבועים שמכילים מאגרי עובדים עם שינוי גודל אוטומטי מופעלים מחדש עם מספר העותקים המינימלי.
המאמרים הבאים
- מידע נוסף על משאבים קבועים
- יצירה ושימוש במשאב מתמשך
- הרצת משימות אימון במשאב מתמשך.
- קבלת מידע על משאב קבוע
- מחיקת משאב מתמשך.