בדף הזה מוסבר איך להריץ משימת אימון ללא שרת במשאב מתמשך באמצעות Google Cloud CLI, Vertex AI SDK ל-Python ו-API בארכיטקטורת REST.
בדרך כלל, כשיוצרים משימת אימון בלי שרת (serverless), צריך לציין משאבי מחשוב שהמשימה יוצרת ומופעלת עליהם. אחרי שיוצרים משאב מתמשך, אפשר להגדיר את המשימה serverless trainingjob כך שתפעל במאגר משאבים אחד או יותר של המשאב המתמשך הזה. הפעלת משימת אימון בהתאמה אישית במשאב קבוע מקצרת משמעותית את זמן ההפעלה של המשימה, שנדרש בדרך כלל ליצירת משאב מחשוב.
התפקידים הנדרשים
כדי לקבל את ההרשאה שנדרשת להרצת משימות אימון בלי שרת (serverless) במשאב מתמשך, צריך לבקש מהאדמין להקצות לכם את תפקיד ה-IAM Vertex AI User (roles/aiplatform.user) בפרויקט.
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
התפקיד המוגדר מראש הזה כולל את ההרשאה aiplatform.customJobs.create, שנדרשת כדי להריץ משימות אימון ללא שרת במשאב קבוע.
יכול להיות שתוכלו לקבל את ההרשאה הזו גם בתפקידים בהתאמה אישית או בתפקידים אחרים שמוגדרים מראש.
יצירת משימת אימון שפועלת במשאב מתמיד
כדי ליצור משימת אימון ללא שרת שפועלת במשאב מתמשך, מבצעים את השינויים הבאים בהוראות הרגילות ליצירת משימת אימון ללא שרת:
gcloud
- מציינים את הדגל
--persistent-resource-idומגדירים את הערך למזהה של המשאב הקבוע (PERSISTENT_RESOURCE_ID) שרוצים להשתמש בו. - מציינים את הדגל
--worker-pool-specכך שהערכים שלmachine-typeו-disk-typeיתאימו בדיוק למאגר משאבים תואם מהמשאב הקבוע. מציינים 1 לשימוש באימון של צומת יחיד, ומספר גדול יותר לאימון מבוזר.--worker-pool-spec - מציינים
replica-countless than or equal tomax-replica-countאוreplica-countשל מאגר המשאבים המתאים.
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
REST
- מציינים את הפרמטר
persistent_resource_idומגדירים את הערך למזהה של המשאב הקבוע (PERSISTENT_RESOURCE_ID) שרוצים להשתמש בו. - מציינים את הפרמטר
worker_pool_specsכך שהערכים שלmachine_specושלdisk_specלכל מאגר משאבים יתאימו בדיוק למאגר משאבים תואם מהמשאב הקבוע. מצייניםmachine_specלאימון של צומת יחיד, וכמה צמתים לאימון מבוזר. - מציינים ערך של
replica_countשהוא קטן מ-replica_countאו שווה לו, אוmax_replica_countשל מאגר המשאבים המתאים, לא כולל את מספר הרפליקות של משימות אחרות שפועלות במאגר המשאבים הזה.
המאמרים הבאים
- מידע נוסף על משאבים קבועים
- יצירה ושימוש במשאב מתמשך
- קבלת מידע על משאב קבוע
- הפעלה מחדש של משאב מתמשך
- מחיקת משאב מתמשך.