שלום אימון בהתאמה אישית: אימון מודל מותאם אישית לסיווג תמונות

בדף הזה מוסבר איך להריץ אפליקציה לאימון TensorFlow Keras ב-Vertex AI. המודל הספציפי הזה מאמן מודל לסיווג תמונות שיכול לסווג פרחים לפי סוג.

המדריך הזה כולל כמה דפים:

  1. הגדרת הפרויקט והסביבה.

  2. אימון מודל מותאם אישית לסיווג תמונות.

  3. הצגת חיזויים ממודל סיווג תמונות בהתאמה אישית.

  4. פינוי מקום בפרויקט

בכל דף מניחים שכבר ביצעתם את ההוראות מהדפים הקודמים של המדריך.

בהמשך המסמך הזה נניח שאתם משתמשים באותה סביבת Cloud Shell שיצרתם כשפעלתם לפי ההוראות בדף הראשון של המדריך הזה. אם הסשן המקורי של Cloud Shell כבר לא פתוח, אפשר לחזור לסביבה באופן הבא:

  1. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

  2. בסשן של Cloud Shell, מריצים את הפקודה הבאה:

    cd hello-custom-sample
  3. הפעלת צינור לעיבוד נתונים לצורך אימון בהתאמה אישית

    בקטע הזה מוסבר איך להשתמש בחבילת האימון שהעליתם ל-Cloud Storage כדי להריץ צינור אימון בהתאמה אישית ב-Vertex AI.

    1. במסוף Google Cloud , בקטע Vertex AI, עוברים לדף Training pipelines.

      מעבר אל 'אימון צינורות עיבוד נתונים'

    2. לוחצים על יצירה כדי לפתוח את החלונית אימון מודל חדש.

    3. בשלב Choose training method (בחירת שיטת אימון), מבצעים את הפעולות הבאות:

      1. בתפריט הנפתח קבוצת נתונים, בוחרים באפשרות אין קבוצת נתונים מנוהלת. אפליקציית האימון הספציפית הזו טוענת נתונים מהספרייה TensorFlow Datasets ולא ממערך נתונים מנוהל של Vertex AI.

      2. מוודאים שהאפשרות אימון מותאם אישית (מתקדם) נבחרה.

      לוחצים על Continue.

    4. בשלב פרטי המודל, בשדה שם, מזינים hello_custom. לוחצים על המשך.

    5. בשלב Training container (קונטיינר אימון), מספקים ל-Vertex AI את המידע הדרוש כדי להשתמש בחבילת האימון שהעליתם ל-Cloud Storage:

      1. בוחרים באפשרות מאגר תגים מוכן מראש.

      2. ברשימה הנפתחת Model framework בוחרים באפשרות TensorFlow.

      3. ברשימה הנפתחת Model framework version בוחרים באפשרות 2.3.

      4. בשדה Package location (מיקום החבילה), מזינים את הערך cloud-samples-data/ai-platform/hello-custom/hello-custom-sample-v1.tar.gz.

      5. בשדה Python module, מזינים trainer.task. ‫trainer הוא השם של חבילת Python בקובץ ה-tarball, ו-task.py מכיל את קוד האימון. לכן, trainer.task הוא שם המודול שרוצים ש-Vertex AI יפעיל.

      6. בשדה Model output directory (ספריית פלט של המודל), לוחצים על Browse (עיון). בחלונית Select folder (בחירת תיקייה):

        1. מנווטים לקטגוריה של Cloud Storage.

        2. לוחצים על יצירת תיקייה חדשה .

        3. נותנים לתיקייה החדשה את השם output. ואז לוחצים על יצירה.

        4. לוחצים על בחירה.

        מוודאים שהערך בשדה הוא gs://BUCKET_NAME/output, כאשר BUCKET_NAME הוא השם של הקטגוריה שלכם ב-Cloud Storage.

        הערך הזה מועבר אל Vertex AI בשדה baseOutputDirectory API, שקובע כמה משתני סביבה שאפליקציית האימון יכולה לגשת אליהם כשהיא פועלת.

        לדוגמה, אם מגדירים את השדה הזה ל-gs://BUCKET_NAME/output, ‏ Vertex AI מגדיר את משתנה הסביבה AIP_MODEL_DIR ל-gs://BUCKET_NAME/output/model. בסיום האימון, Vertex AI משתמש בארטיפקטים שבספרייה AIP_MODEL_DIR כדי ליצור משאב מודל.

        מידע נוסף על משתני הסביבה שמוגדרים בשדה הזה

      לוחצים על Continue.

    6. בשלב האופציונלי Hyperparameters, מוודאים שתיבת הסימון Enable hyperparameter tuning לא מסומנת. במדריך הזה לא נעשה שימוש בכוונון של היפרפרמטרים. לוחצים על המשך.

    7. בשלב Compute and pricing (מחשוב ותמחור), מקצים משאבים למשימת האימון המותאמת אישית:

      1. ברשימה הנפתחת Region, בוחרים באפשרות us-central1 (Iowa).

      2. ברשימה הנפתחת Machine type (סוג המכונה), בוחרים באפשרות n1-standard-4 בקטע Standard (רגיל).

      אל תוסיפו מאיצים או מאגרי עובדים למדריך הזה. לוחצים על המשך.

    8. בשלב Prediction container (מאגר חיזוי), מספקים ל-Vertex AI את המידע שדרוש לו כדי להציג חיזויים:

      1. בוחרים באפשרות מאגר תגים מוכן מראש.

      2. בקטע Prebuilt container settings (הגדרות של מאגר תגים מוכן מראש), מבצעים את הפעולות הבאות:

        1. ברשימה הנפתחת Model framework בוחרים באפשרות TensorFlow.

        2. ברשימה הנפתחת Model framework version בוחרים באפשרות 2.3.

        3. ברשימה הנפתחת סוג המאיץ, בוחרים באפשרות ללא.

        4. מוודאים שבשדה Model directory (ספריית המודל) מופיע הערך gs://BUCKET_NAME/output, כאשר BUCKET_NAME הוא השם של הקטגוריה של Cloud Storage. הערך הזה זהה לערך של ספריית פלט המודל שציינתם בשלב הקודם.

      3. משאירים את השדות בקטע Predict schemata (תכנון תחזיות) ריקים.

    9. כדי להפעיל את צינור ההכשרה המותאם אישית, לוחצים על Start training (התחלת ההכשרה).

    בדף Training תוכלו לראות את צינור העיבוד לאימון החדש שלכם, שנקרא hello_custom. (יכול להיות שתצטרכו לרענן את הדף). תהליך האימון מבצע שתי פעולות עיקריות:

    1. צינור האימון יוצר משאב custom job בשם hello_custom-custom-job. אחרי כמה רגעים, תוכלו לראות את המשאב הזה בדף Custom jobs בקטע Training:

      מעבר למשימות בהתאמה אישית

      העבודה המותאמת אישית מריצה את אפליקציית האימון באמצעות משאבי המחשוב שצוינו בקטע הזה.

    2. אחרי שהמשימה המותאמת אישית מסתיימת, צינור ההדרכה מוצא את הארטיפקטים שאפליקציית ההדרכה יוצרת בספרייה output/model/ של קטגוריית Cloud Storage. הוא משתמש בארטיפקטים האלה כדי ליצור משאב מודל.

    מעקב אחרי אימון

    כדי לראות את יומני האימון:

    1. במסוף Google Cloud , בקטע Vertex AI, עוברים לדף Custom jobs.

      מעבר למשימות בהתאמה אישית

    2. כדי לראות את הפרטים של CustomJob שיצרתם, לוחצים על hello_custom-custom-job ברשימה.

    3. בדף פרטי העבודה, לוחצים על הצגת יומנים.

    צפייה במודל שאומן

    כשתהליך ההדרכה המותאם אישית מסתיים, אפשר למצוא את המודל שאומן ב Google Cloud מסוף, בקטע Vertex AI, בדף Models.

    מעבר אל 'מודלים'

    שם המודל הוא hello_custom.

    המאמרים הבאים

    כדי להציג תחזיות ממודל ה-ML שאומן, פועלים לפי ההוראות בדף הבא של המדריך הזה.