המסמכים האלה מתייחסים לגרסה העדכנית של Knative serving, שמשתמשת בציים וב-Anthos Service Mesh. מידע נוסף

הגרסה הקודמת (Cloud Run for Anthos) הועברה לארכיון, אבל התיעוד שלה עדיין זמין למשתמשים קיימים.

גרסאות זמינות

הכי חדש
העברה לארכיון

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

שימוש ב-GPU של NVIDIA

בדף הזה מוסבר איך להשתמש במאגרי צמתים עם מאיצי חומרה של יחידות עיבוד גרפיות (GPU) של NVIDIA כדי להפעיל משימות של למידה עמוקה, כמו זיהוי תמונות, עיבוד שפה טבעית ומשימות אחרות שדורשות הרבה כוח מחשוב, באמצעות מופע קונטיינר של Knative Serving.

הוספת מאגר צמתים עם יחידות GPU לאשכול GKE

מבקשים מאדמין ליצור מאגר צמתים עם מעבדי GPU:

הגדרת השירות לשימוש ב-GPU

אפשר לציין מגבלת משאבים לצריכת GPU בשירות באמצעות המסוף Google Cloud או Google Cloud CLI כשמבצעים פריסה של שירות חדש, מעדכנים שירות קיים או פורסים עדכון:

המסוף

מעבר אל Knative serving
לוחצים על Create service (יצירת שירות) כדי להציג את הטופס Create service (יצירת שירות).
בקטע Service settings (הגדרות שירות):
1. בוחרים את אשכול GKE עם מאגר הצמתים שמופעל בו GPU.
2. מציינים את השם שרוצים לתת לשירות.
3. לוחצים על הבא כדי להמשיך לקטע הבא.
בקטע Configure the service's first revision (הגדרת הגרסה הראשונה של השירות):
1. מוסיפים כתובת URL של קובץ אימג' של קונטיינר.
2. לוחצים על הגדרות מתקדמות ובתפריט GPU allocated בוחרים את מספר ה-GPU שרוצים להקצות לשירות.
לוחצים על הבא כדי להמשיך לקטע הבא.
בקטע Configure how this service is triggered (הגדרה של אופן הפעלת השירות), בוחרים את סוג הקישוריות שרוצים להשתמש בו כדי להפעיל את השירות.
לוחצים על יצירה כדי לפרוס את התמונה ב-Knative serving ומחכים עד שהפריסה תסתיים.

שורת הפקודה

אפשר להוריד את ההגדרה של שירות קיים לקובץ YAML באמצעות הפקודה gcloud run services describe והדגל --format=export. אחר כך תוכלו לשנות את קובץ ה-YAML ולפרוס את השינויים האלה באמצעות הפקודה gcloud run services replace. חשוב לוודא שמשנים רק את המאפיינים שצוינו.

מורידים את ההגדרה של השירות לקובץ בשם service.yaml בסביבת העבודה המקומית:
```
gcloud run services describe SERVICE --format export > service.yaml
```
מחליפים את SERVICE בשם של שירות Knative serving.

מעדכנים את המאפיין nvidia.com/gpu בקובץ המקומי:

apiVersion: serving.knative.dev/v1
kind: Service
metadata:
name: SERVICE_NAME
spec:
template:
 spec:
   containers:
   – image: IMAGE_URL
     resources:
       limits:
        nvidia.com/gpu: "GPU_UNITS"

מחליפים את GPU_UNITS בערך ה-GPU הרצוי ביחידות GPU של Kubernetes. לדוגמה, מציינים 1 עבור GPU אחד.

מריצים את הפקודה הבאה כדי לפרוס את קובץ ה-YAML ולהחליף את השירות בתצורה החדשה:
```
gcloud run services replace service.yaml
```

מידע נוסף על ביצועי GPU ועלויות מופיע במאמר בנושא GPU.