יצירת מופע TPU

במסמך הזה מוסבר איך ליצור מכונה וירטואלית (VM) של TPU v6e ‏ (Trillium), להתחבר אליה ולהריץ בה חישוב. במהלך ההתחלה המהירה הזו, תיצרו מופע TPU שמשתמש באפשרות הצריכה שמוגדרת כברירת מחדל – על פי דרישה.

לפני שמתחילים

  1. נכנסים לחשבון Google Cloud . אם אתם משתמשים חדשים ב- Google Cloud, צרו חשבון כדי שתוכלו להעריך את הביצועים של המוצרים שלנו בתרחישים מהעולם האמיתי. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300$ להרצה, לבדיקה ולפריסה של עומסי העבודה.
  2. התקינו את ה-CLI של Google Cloud.

  3. אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.

  4. כדי לאתחל את ה-CLI של gcloud, הריצו את הפקודה הבאה:

    gcloud init
  5. יוצרים או בוחרים Google Cloud פרויקט.

    תפקידים שנדרשים כדי לבחור או ליצור פרויקט

    • Select a project: כדי לבחור פרויקט לא צריך תפקיד IAM ספציפי – אפשר לבחור כל פרויקט שקיבלתם בו תפקיד.
    • יצירת פרויקט: כדי ליצור פרויקט, צריך את התפקיד Project Creator (יצירת פרויקטים) (roles/resourcemanager.projectCreator), שכולל את ההרשאה resourcemanager.projects.create. איך מקצים תפקידים
    • יוצרים Google Cloud פרויקט:

      gcloud projects create PROJECT_ID

      מחליפים את PROJECT_ID בשם של פרויקט Google Cloud שיוצרים.

    • בוחרים את הפרויקט שיצרתם: Google Cloud

      gcloud config set project PROJECT_ID

      מחליפים את PROJECT_ID בשם הפרויקט ב- Google Cloud .

  6. אם משתמשים בפרויקט קיים, מוודאים שיש את ההרשאות הנדרשות כדי להשלים את ההדרכה. אם משתמשים בפרויקט חדש, לא צריך לוודא כי כבר יש את ההרשאות הנדרשות.

  7. מוודאים שהחיוב מופעל בפרויקט Google Cloud .

  8. מפעילים את Compute Engine API:

    תפקידים שנדרשים להפעלת ממשקי API

    כדי להפעיל ממשקי API, צריך את תפקיד ה-IAM 'אדמין של Service Usage' (roles/serviceusage.serviceUsageAdmin), שכולל את ההרשאה serviceusage.services.enable. איך מקצים תפקידים

    gcloud services enable compute.googleapis.com
  9. התקינו את ה-CLI של Google Cloud.

  10. אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.

  11. כדי לאתחל את ה-CLI של gcloud, הריצו את הפקודה הבאה:

    gcloud init
  12. יוצרים או בוחרים Google Cloud פרויקט.

    תפקידים שנדרשים כדי לבחור או ליצור פרויקט

    • Select a project: כדי לבחור פרויקט לא צריך תפקיד IAM ספציפי – אפשר לבחור כל פרויקט שקיבלתם בו תפקיד.
    • יצירת פרויקט: כדי ליצור פרויקט, צריך את התפקיד Project Creator (יצירת פרויקטים) (roles/resourcemanager.projectCreator), שכולל את ההרשאה resourcemanager.projects.create. איך מקצים תפקידים
    • יוצרים Google Cloud פרויקט:

      gcloud projects create PROJECT_ID

      מחליפים את PROJECT_ID בשם של פרויקט Google Cloud שיוצרים.

    • בוחרים את הפרויקט שיצרתם: Google Cloud

      gcloud config set project PROJECT_ID

      מחליפים את PROJECT_ID בשם הפרויקט ב- Google Cloud .

  13. אם משתמשים בפרויקט קיים, מוודאים שיש את ההרשאות הנדרשות כדי להשלים את ההדרכה. אם משתמשים בפרויקט חדש, לא צריך לוודא כי כבר יש את ההרשאות הנדרשות.

  14. מוודאים שהחיוב מופעל בפרויקט Google Cloud .

  15. מפעילים את Compute Engine API:

    תפקידים שנדרשים להפעלת ממשקי API

    כדי להפעיל ממשקי API, צריך את תפקיד ה-IAM 'אדמין של Service Usage' (roles/serviceusage.serviceUsageAdmin), שכולל את ההרשאה serviceusage.services.enable. איך מקצים תפקידים

    gcloud services enable compute.googleapis.com

התפקידים הנדרשים

כדי לקבל את ההרשאות שדרושות ליצירת מכונת TPU, להתחבר אליה באמצעות SSH ולהריץ פקודות, צריך לבקש מהאדמין להקצות לכם בפרויקט את תפקידי ה-IAM הבאים:

להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.

יצירת מופע TPU v6e ‏ (Trillium)

מריצים את הפקודות הבאות בטרמינל המקומי או באמצעות Cloud Shell.

  1. כדי ליצור מופע TPU v6e, מריצים את הפקודה gcloud compute instances create הבאה:

    gcloud compute instances create quickstart-tpu \
        --machine-type=ct6e-standard-4t \
        --zone=europe-west4-a \
        --image-project=ubuntu-os-accelerator-images \
        --image-family=ubuntu-accel-2204-amd64-tpu-v5e-v5p-v6e \
        --maintenance-policy=TERMINATE
    
  2. אפשר גם לוודא שהמכונה פועלת באמצעות הפקודה gcloud compute instances describe:

    gcloud compute instances describe quickstart-tpu --zone=europe-west4-a
    

    בפלט, בודקים את השדה status כדי לוודא שהמופע פועל או שהוא עדיין בהמתנה.

התחברות למכונת TPU

אפשר להתחבר למכונת TPU באמצעות מסוף Google Cloud או ה-CLI של gcloud.

כדי להתחבר למכונה הווירטואלית באמצעות SSH, מריצים את הפקודה gcloud compute ssh הבאה:

gcloud compute ssh quickstart-tpu --zone=europe-west4-a

התקנה של JAX

מריצים את הפקודה הבאה במופע TPU כדי להתקין את מסגרת JAX:

pip install jax[tpu] -f https://storage.googleapis.com/jax-releases/libtpu_releases.html

הרצה של בדיקת מערכת

כדי לוודא של-JAX יש גישה ל-TPU והיא יכולה להריץ פעולות בסיסיות, מריצים את הפקודות הבאות במופע ה-TPU:

  1. מפעילים את מתורגמן Python 3:

    python3
    
  2. מייבאים את מודול JAX:

    >>> import jax
    
  3. הצגת מספר ליבות ה-TPU הזמינות:

    >>> jax.device_count()
    

    בפלט מוצג מספר ליבות ה-TPU. מספר הליבות תלוי בגרסת ה-TPU שבה אתם משתמשים. מידע נוסף זמין במאמר בנושא גרסאות TPU.

ביצוע חישוב

  1. מריצים את הפקודה הבאה כדי לחבר שני מספרים:

    >>> jax.numpy.add(1, 1)
    

    הפלט אמור להיראות כך:

    >>> Array(2, dtype=int32, weak_type=True)
    
  2. יוצאים ממתורגמן Python:

    >>> 
    exit()
    

הסרת המשאבים

כדי לא לצבור חיובים בחשבון על המשאבים שבהם השתמשתם בדף הזה, אתם צריכים למחוק את הפרויקט יחד עם המשאבים. Google Cloud Google Cloud

לחלופין, אם רוצים לשמור את הפרויקט, אפשר למחוק רק את המכונה הווירטואלית באמצעות הפקודה gcloud compute instances delete:

gcloud compute instances delete quickstart-tpu --zone=europe-west4-a

המאמרים הבאים