הגדרת מספר מקסימלי של מופעים של מאגרי תגים

כאן מוסבר איך מגדירים את המספר המקסימלי של מופעי מאגר שאפשר להשתמש בהם בשירות Knative Serving. הגדרה של מספר מופעים מקסימלי ב-Knative serving מאפשרת להגביל את ההתאמה של השירות בתגובה לבקשות נכנסות. אפשר להשתמש בהגדרה הזו כדי לשלוט בעלויות או להגביל את מספר החיבורים לשירות גיבוי, למשל למסד נתונים.

מידע נוסף על האופן שבו Knative Serving מבצע התאמה אוטומטית לעומס של מופעי קונטיינרים זמין במאמר בנושא התאמה אוטומטית לעומס של מופעים.

הגדרה ועדכון של מספר מופעים מקסימלי

כל שינוי בהגדרות מוביל ליצירה של גרסה חדשה. גם גרסאות עתידיות יקבלו את הגדרת התצורה הזו באופן אוטומטי, אלא אם תבצעו עדכונים מפורשים כדי לשנות אותה.

כברירת מחדל, מספר מופעי הקונטיינר יכול לגדול ללא הגבלה. אפשר להגדיר גבול עליון למספר המקסימלי של מופעים באמצעותGoogle Cloud המסוף או Google Cloud CLI כשפורסים שירות חדש או מעדכנים שירות קיים ופורסים עדכון:

המסוף

  1. נכנסים אל Knative serving במסוף Google Cloud :

    מעבר אל Knative serving

  2. אם אתם מגדירים שירות חדש שאתם פורסים, לוחצים על יצירת שירות. אם אתם מגדירים שירות קיים, לוחצים על השירות ואז על Edit & Deploy New Revision (עריכה ופריסה של עדכון חדש).

  3. בקטע הגדרות מתקדמות, לוחצים על מאגר תגים.

  4. בשדה Maximum number of instances (מספר המופעים המקסימלי), מציינים את המספר המקסימלי הרצוי של מופעי קונטיינר.

  5. לוחצים על הבא כדי להמשיך לקטע הבא.

  6. בקטע Configure how this service is triggered (הגדרה של אופן הפעלת השירות), בוחרים את סוג הקישוריות שרוצים להשתמש בו כדי להפעיל את השירות.

  7. לוחצים על יצירה כדי לפרוס את התמונה ב-Knative serving ומחכים עד שהפריסה תסתיים.

שורת הפקודה

  • בשירותים קיימים, כדי להגדיר את המספר המקסימלי של מופעי קונטיינרים, מריצים את הפקודה gcloud run services update עם הפרמטר --max-instances:

    gcloud run services update SERVICE --max-instances MAX-VALUE

    מחליפים את:

    • SERVICE בשם של השירות.
    • MAX-VALUE עם המספר המקסימלי הרצוי של מופעי מאגר. מציינים default כדי למחוק את ההגדרה של מספר המופעים המקסימלי.
  • בשירותים חדשים, מגדירים את המספר המקסימלי של מופעי מאגר התגים על ידי הפעלת הפקודה gcloud run deploy עם הפרמטר --max-instances:

    gcloud run deploy SERVICE --image=IMAGE_URL --max-instances MAX-VALUE

    מחליפים את:

    • SERVICE בשם של השירות.
    • IMAGE_URL עם הפניה לקובץ אימג' של קונטיינר, לדוגמה, gcr.io/cloudrun/hello.
    • MAX-VALUE עם המספר המקסימלי הרצוי של מופעי מאגר. מציינים default כדי למחוק את ההגדרה של מספר המופעים המקסימלי.

YAML

אפשר להוריד את ההגדרה של שירות קיים לקובץ YAML באמצעות הפקודה gcloud run services describe והדגל --format=export. אחר כך תוכלו לשנות את קובץ ה-YAML ולפרוס את השינויים האלה באמצעות הפקודה gcloud run services replace. חשוב לוודא שמשנים רק את המאפיינים שצוינו.

  1. מורידים את ההגדרה של השירות לקובץ בשם service.yaml בסביבת העבודה המקומית:

    gcloud run services describe SERVICE --format export > service.yaml

    מחליפים את SERVICE בשם של שירות Knative serving.

  2. בקובץ המקומי, מעדכנים את המאפיין autoscaling.knative.dev/maxScale::

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' 

    החלפה

    • MAX-INSTANCE עם המספר המקסימלי הרצוי.
  3. מחליפים את השירות בהגדרה החדשה שלו באמצעות הפקודה הבאה:

    gcloud run services replace service.yaml