יצירת מופע TPU
במסמך הזה מוסבר איך ליצור מכונה וירטואלית (VM) של TPU v6e (Trillium), להתחבר אליה ולהריץ בה חישוב. במהלך ההתחלה המהירה הזו, תיצרו מופע TPU שמשתמש באפשרות הצריכה שמוגדרת כברירת מחדל – על פי דרישה.
לפני שמתחילים
- נכנסים לחשבון Google Cloud . אם אתם משתמשים חדשים ב- Google Cloud, צרו חשבון כדי שתוכלו להעריך את הביצועים של המוצרים שלנו בתרחישים מהעולם האמיתי. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300$ להרצה, לבדיקה ולפריסה של עומסי העבודה.
-
התקינו את ה-CLI של Google Cloud.
-
אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.
-
כדי לאתחל את ה-CLI של gcloud, הריצו את הפקודה הבאה:
gcloud init -
יוצרים או בוחרים Google Cloud פרויקט.
תפקידים שנדרשים כדי לבחור או ליצור פרויקט
- Select a project: כדי לבחור פרויקט לא צריך תפקיד IAM ספציפי – אפשר לבחור כל פרויקט שקיבלתם בו תפקיד.
-
יצירת פרויקט: כדי ליצור פרויקט, צריך את התפקיד Project Creator (יצירת פרויקטים) (
roles/resourcemanager.projectCreator), שכולל את ההרשאהresourcemanager.projects.create. איך מקצים תפקידים
-
יוצרים Google Cloud פרויקט:
gcloud projects create PROJECT_ID
מחליפים את
PROJECT_IDבשם של פרויקט Google Cloud שיוצרים. -
בוחרים את הפרויקט שיצרתם: Google Cloud
gcloud config set project PROJECT_ID
מחליפים את
PROJECT_IDבשם הפרויקט ב- Google Cloud .
-
אם משתמשים בפרויקט קיים, מוודאים שיש את ההרשאות הנדרשות כדי להשלים את ההדרכה. אם משתמשים בפרויקט חדש, לא צריך לוודא כי כבר יש את ההרשאות הנדרשות.
מפעילים את Compute Engine API:
תפקידים שנדרשים להפעלת ממשקי API
כדי להפעיל ממשקי API, צריך את תפקיד ה-IAM 'אדמין של Service Usage' (
roles/serviceusage.serviceUsageAdmin), שכולל את ההרשאהserviceusage.services.enable. איך מקצים תפקידיםgcloud services enable compute.googleapis.com
-
התקינו את ה-CLI של Google Cloud.
-
אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.
-
כדי לאתחל את ה-CLI של gcloud, הריצו את הפקודה הבאה:
gcloud init -
יוצרים או בוחרים Google Cloud פרויקט.
תפקידים שנדרשים כדי לבחור או ליצור פרויקט
- Select a project: כדי לבחור פרויקט לא צריך תפקיד IAM ספציפי – אפשר לבחור כל פרויקט שקיבלתם בו תפקיד.
-
יצירת פרויקט: כדי ליצור פרויקט, צריך את התפקיד Project Creator (יצירת פרויקטים) (
roles/resourcemanager.projectCreator), שכולל את ההרשאהresourcemanager.projects.create. איך מקצים תפקידים
-
יוצרים Google Cloud פרויקט:
gcloud projects create PROJECT_ID
מחליפים את
PROJECT_IDבשם של פרויקט Google Cloud שיוצרים. -
בוחרים את הפרויקט שיצרתם: Google Cloud
gcloud config set project PROJECT_ID
מחליפים את
PROJECT_IDבשם הפרויקט ב- Google Cloud .
-
אם משתמשים בפרויקט קיים, מוודאים שיש את ההרשאות הנדרשות כדי להשלים את ההדרכה. אם משתמשים בפרויקט חדש, לא צריך לוודא כי כבר יש את ההרשאות הנדרשות.
מפעילים את Compute Engine API:
תפקידים שנדרשים להפעלת ממשקי API
כדי להפעיל ממשקי API, צריך את תפקיד ה-IAM 'אדמין של Service Usage' (
roles/serviceusage.serviceUsageAdmin), שכולל את ההרשאהserviceusage.services.enable. איך מקצים תפקידיםgcloud services enable compute.googleapis.com
התפקידים הנדרשים
כדי לקבל את ההרשאות שדרושות ליצירת מכונת TPU, להתחבר אליה באמצעות SSH ולהריץ פקודות, צריך לבקש מהאדמין להקצות לכם בפרויקט את תפקידי ה-IAM הבאים:
- Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1) - משתמש בחשבון שירות (
roles/iam.serviceAccountUser) - אדמין Service Usage (
roles/serviceusage.serviceUsageAdmin)
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.
יצירת מופע TPU v6e (Trillium)
מריצים את הפקודות הבאות בטרמינל המקומי או באמצעות Cloud Shell.
כדי ליצור מופע TPU v6e, מריצים את הפקודה
gcloud compute instances createהבאה:gcloud compute instances create quickstart-tpu \ --machine-type=ct6e-standard-4t \ --zone=europe-west4-a \ --image-project=ubuntu-os-accelerator-images \ --image-family=ubuntu-accel-2204-amd64-tpu-v5e-v5p-v6e \ --maintenance-policy=TERMINATEאפשר גם לוודא שהמכונה פועלת באמצעות הפקודה
gcloud compute instances describe:gcloud compute instances describe quickstart-tpu --zone=europe-west4-aבפלט, בודקים את השדה
statusכדי לוודא שהמופע פועל או שהוא עדיין בהמתנה.
התחברות למכונת TPU
אפשר להתחבר למכונת TPU באמצעות מסוף Google Cloud או ה-CLI של gcloud.
כדי להתחבר למכונה הווירטואלית באמצעות SSH, מריצים את הפקודה gcloud compute
ssh הבאה:
gcloud compute ssh quickstart-tpu --zone=europe-west4-a
התקנה של JAX
מריצים את הפקודה הבאה במופע TPU כדי להתקין את מסגרת JAX:
pip install jax[tpu] -f https://storage.googleapis.com/jax-releases/libtpu_releases.html
הרצה של בדיקת מערכת
כדי לוודא של-JAX יש גישה ל-TPU והיא יכולה להריץ פעולות בסיסיות, מריצים את הפקודות הבאות במופע ה-TPU:
מפעילים את מתורגמן Python 3:
python3מייבאים את מודול JAX:
>>> import jaxהצגת מספר ליבות ה-TPU הזמינות:
>>> jax.device_count()בפלט מוצג מספר ליבות ה-TPU. מספר הליבות תלוי בגרסת ה-TPU שבה אתם משתמשים. מידע נוסף זמין במאמר בנושא גרסאות TPU.
ביצוע חישוב
מריצים את הפקודה הבאה כדי לחבר שני מספרים:
>>> jax.numpy.add(1, 1)הפלט אמור להיראות כך:
>>> Array(2, dtype=int32, weak_type=True)יוצאים ממתורגמן Python:
>>> exit()
הסרת המשאבים
כדי לא לצבור חיובים בחשבון על המשאבים שבהם השתמשתם בדף הזה, אתם צריכים למחוק את הפרויקט יחד עם המשאבים. Google Cloud Google Cloud
לחלופין, אם רוצים לשמור את הפרויקט, אפשר למחוק רק את המכונה הווירטואלית באמצעות הפקודה gcloud compute instances delete:
gcloud compute instances delete quickstart-tpu --zone=europe-west4-a