הגדרת מספר מינימלי של מופעים לשירותים

בדף הזה מוסבר איך להפעיל מופעים במצב המתנה בשירות על ידי הגדרת מספר מינימלי של מופעים באמצעות התנהגות ברירת המחדל של התאמת קנה מידה אוטומטית ב-Cloud Run. כדי לשנות את קנה המידה של השירות באופן ידני, אפשר לעיין במאמר בנושא שינוי קנה מידה ידני.

אם אתם צריכים שליטה רבה יותר על התנהגות ההרחבה האוטומטית של השירות, אתם יכולים להגדיר מספר מינימלי של מופעים כדי למנוע זמני הפעלה איטיים של קונטיינרים ולצמצם את זמן האחזור של השירות. בשירותי Cloud Run, המערכת מבצעת סקייל-אין למספר המכונות על סמך מספר הבקשות הנכנסות.

עם זאת, אם השירות שלכם דורש חביון נמוך, במיוחד כשמגדילים את מספר המופעים הפעילים מאפס, אתם יכולים לשנות את התנהגות ברירת המחדל הזו על ידי ציון מספר מינימלי של מופעי מאגר תגים שצריך לשמור במצב מוכן כדי לטפל בבקשות. מידע נוסף על האופטימיזציה הזו זמין במאמר בנושא טיפים כלליים לפיתוח.

‫Cloud Run מסיר מופעים שלא מעבדים בקשות (במצב סרק). אם מגדירים מספר מינימלי של מופעים, Cloud Run מפעיל לפחות את המספר הזה של מופעים, גם אם הם לא מעבדים בקשות. אם לא מתקבלות בקשות במופעים פעילים מעל המספר min-instances, יכול להיות שהם יהפכו ללא פעילים.

לדוגמה, אם min-instances הוא 10, ומספר המופעים הפעילים הוא 0, אז מספר המופעים הלא פעילים הוא 10. כאשר מספר המופעים הפעילים עולה ל-6, מספר המופעים הלא פעילים יורד ל-4.

שימו לב: אם שירות לא הציג תנועה לאחרונה, מדד המופעים הפעילים יכול להצביע על כך שאין מופעים פעילים, גם אם ציינתם מופע מינימלי אחד או יותר.

אפשר להפעיל מחדש את המינימום של המופעים בכל שלב.

חיוב

הפעלת מכונות באמצעות התכונה 'מכונות מינימליות' כרוכה בעלויות חיוב.

בתרשים הבא אפשר לראות איך החיוב מתבצע במהלך מחזור החיים של מופע כשמגדירים מופעים מינימליים לשירות או לגרסה:

הפעלת Cloud Run Admin API ממסוף Google Cloud .
איור 1. דוגמה למופע שמקבל ומעבד שלוש בקשות.

בהתאם להגדרות החיוב שנקבעו, החיוב על השירות מתבצע באופן הבא:

  • בחיוב לפי בקשה, אתם מחויבים בתעריף נמוך יותר כשהמופעים במצב המתנה לעיבוד בקשות. אם הערך של min instances (מספר המופעים המינימלי) מוגדר ל-0, לא נחייב אתכם כשהמופעים לא פעילים.
  • בחיוב לפי מופע, אתם מחויבים בשיעור ברירת המחדל לכל מחזור החיים של המופע. הזמן שחלף מההפעלה ועד הכיבוי כולל את הזמן שבו מופע מעבד בקשות או נמצא במצב המתנה. במילים אחרות, גם אם הערך של min instances מוגדר כ-0, עדיין תחויבו בתעריף ברירת המחדל. האפשרות הזו מתאימה אם אתם צריכים CPU מחוץ לבקשות. אם הערך של min instances מוגדר כ-0, החיוב הוא לפי תעריף ברירת המחדל.
מכיוון שאפשר לצפות את החיובים האלה, Google ממליצה לרכוש הנחה תמורת התחייבות לשימוש.

החלת מספר מופעים מינימלי ברמת השירות לעומת ברמת השינוי

אפשר להגדיר את מספר המופעים המינימלי ברמת השירות או ברמת העדכון. ‫Google ממליצה להחיל את המכונות המינימליות ברמת השירות ולהימנע משילוב של מכונות מינימליות ברמת השירות וברמת השינוי. מידע נוסף על ההתנהגות כשמגדירים הגדרות קנה מידה ברמת השירות וברמת השינוי

אם מחילים את ההגדרות של מספר מופעים מינימלי ברמת השינוי, ההגדרות ייכנסו לתוקף עם הפריסה של השינוי. אם תפעילו את התכונה הזו ברמת השירות, ההגדרה תיכנס לתוקף בלי שתצטרכו לפרוס גרסה חדשה.

עדכונים ומספר מופעים מינימלי

כשהמספר המינימלי של מופעים מוגדר ברמת השירות, הבקשות הנכנסות מופצות לכל הגרסאות שמציגות תנועה באופן יחסי לפיצול התנועה.

כשמגדירים את מספר המופעים המינימלי ברמת התיקון, מופעים מינימליים מופעלים בכל פעם שיש הפניה לתיקון בחלוקת תנועה או כשמוקצה לו תג תנועה. המשמעות היא שהחיוב על המופע מתבצע בזמן עיבוד הבקשות וגם בזמן ההמתנה לבקשות נכנסות.

גרסאות מתויגות ומופעים מינימליים ברמת השירות

אם מתחילים הפעלה של עדכון עם תג שהוקצה, המופע נספר במסגרת המינימום של מופעים ברמת השירות אם הוא חלק מפיצול תנועה.

ניתוב בקשות עם מספר מינימלי של מופעים

כשמגדירים מספר מינימלי של מופעים, Cloud Run מחלק את הבקשות הנכנסות באופן שווה בין כל המופעים שהוקצו. הבנת ההתנהגות הזו חשובה לניהול העלויות, במיוחד אם החיוב מתבצע לפי בקשות או אם אתם מתכוונים לשמור על מופעי hot spare במצב סרק. כדי לצמצם את העלויות, צריך להגדיר את מספר המופעים המינימלי למספר המופעים שנדרשים כדי לטפל בתנועה האופיינית.

התפקידים הנדרשים

כדי לקבל את ההרשאות שדרושות להגדרה ולפריסה של שירותי Cloud Run, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים:

אם אתם פורסים שירות או פונקציה מקוד מקור, אתם צריכים גם לקבל תפקידים נוספים בפרויקט ובחשבון השירות של Cloud Build.

רשימת ההרשאות והתפקידים ב-IAM שמשויכים ל-Cloud Run מופיעה במאמרים תפקידי IAM ב-Cloud Run והרשאות IAM ב-Cloud Run. אם שירות Cloud Run שלכם מתקשר עםGoogle Cloud ממשקי API, כמו ספריות לקוח ב-Cloud, כדאי לעיין במדריך להגדרת זהות שירות. מידע נוסף על מתן תפקידים זמין במאמרים הרשאות פריסה וניהול גישה.

הגדרת מספר מינימלי של מופעים ברמת השירות

כברירת מחדל, המינימום של המופעים ברמת השירות מושבת במופעי קונטיינרים, וההגדרה היא 0. אפשר לשנות את ברירת המחדל הזו באמצעות מסוףGoogle Cloud , Google Cloud CLI או קובץ YAML:

המסוף

  1. נכנסים לדף Services של Cloud Run במסוף Google Cloud :

    כניסה ל-Cloud Run

  2. אם מגדירים שירות חדש, לוחצים על Deploy container (פריסת מאגר) כדי להציג את הטופס Create service (יצירת שירות). מחפשים את הטופס Service scaling (התאמת השירות).

  3. אם אתם מגדירים שירות קיים, לוחצים על השירות כדי להציג את חלונית הפרטים שלו, ואז לוחצים על עריכת הגדרות ההתאמה של רמת השירות בפינה השמאלית העליונה של חלונית הפרטים.

  4. בשדה Minimum number of instances (מספר המופעים המינימלי), מציינים את מספר מופעי הקונטיינר שצריך לשמור במצב פעיל ומוכן לקבלת בקשות.

  5. לוחצים על יצירה כדי ליצור שירות חדש או על פריסה כדי לפרוס שירות קיים.

gcloud

כדי לעדכן את המספר המינימלי של מופעים בשירות מסוים, משתמשים בפקודה הבאה:

gcloud run services update SERVICE --min MIN-VALUE

מחליפים את מה שכתוב בשדות הבאים:

  • SERVICE: השם של השירות.
  • MIN-VALUE: מספר מופעי הקונטיינרים שצריך לשמור במצב מוכן לקבלת בקשות. מציינים default כדי לנקות את ההגדרה של ערך מינימלי של מופעים.

אפשר גם להגדיר את המספר המינימלי של מופעים במהלך הפריסה באמצעות הפקודה:

gcloud run deploy --image IMAGE_URL --min MIN-VALUE

מחליפים את מה שכתוב בשדות הבאים:

  • IMAGE_URL: הפניה לקובץ אימג' של קונטיינר, לדוגמה, us-docker.pkg.dev/cloudrun/container/hello:latest. אם אתם משתמשים ב-Artifact Registry, צריך ליצור מראש את המאגר REPO_NAME. כתובת ה-URL היא בפורמט LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG .
  • MIN-VALUE: מספר המקרים של קונטיינרים שצריך לשמור במצב מוכן לקבלת בקשות. מציינים default כדי לנקות את הגדרת המינימום של המופע.

YAML

כל שינוי בהגדרות מוביל ליצירה של גרסה חדשה. גם גרסאות מתוקנות עתידיות יקבלו את הגדרת התצורה הזו באופן אוטומטי, אלא אם תבצעו עדכונים מפורשים כדי לשנות אותה.

  1. אם אתם יוצרים שירות חדש, דלגו על השלב הזה. כדי לעדכן שירות קיים, מורידים את הגדרות ה-YAML שלו:

    gcloud run services describe SERVICE --format export > service.yaml
  2. מעדכנים את המאפיין run.googleapis.com/minScale:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
      annotations:
        run.googleapis.com/minScale: 'MIN_INSTANCE'

    מחליפים את מה שכתוב בשדות הבאים:

    • SERVICE: השם של שירות Cloud Run
    • MIN-INSTANCE: מספר המופעים שצריך לשמור במצב פעיל, מוכנים לקבל בקשות.
  3. יוצרים או מעדכנים את השירות באמצעות הפקודה הבאה:

    gcloud run services replace service.yaml

    אם קיים קובץ service.yaml, הפקודה gcloud run services replace משתמשת בו כברירת מחדל.

ספריות לקוח

כדי לעדכן את מספר המינימום של המופעים ברמת השירות בשביל השירות שלכם מקוד:

‫API בארכיטקטורת REST

כדי לעדכן את מספר המינימום של מופעים ברמת השירות בשירות נתון, שולחים PATCHבקשת HTTP לנקודת הקצה service של Cloud Run Admin API.

לדוגמה, באמצעות curl:

curl -H "Content-Type: application/json" \
-H "Authorization: Bearer ACCESS_TOKEN" \
-X PATCH \
-d '{ "scaling": { "minInstanceCount": MIN-VALUE }}' \
https://run.googleapis.com/v2/projects/PROJECT_ID/locations/REGION/services/SERVICE?update_mask=scaling.minInstanceCount

מחליפים את מה שכתוב בשדות הבאים:

  • ACCESS_TOKEN: אסימון גישה תקין לחשבון שיש לו הרשאות IAM לעדכון שירות. לדוגמה, אם אתם מחוברים ל-gcloud, אתם יכולים לאחזר טוקן גישה באמצעות gcloud auth print-access-token. מתוך מופע קונטיינר של Cloud Run, אפשר לאחזר אסימון גישה באמצעות שרת המטא-נתונים של מופע הקונטיינר.
  • MIN-VALUE: מספר המקרים של קונטיינרים שצריך לשמור במצב פעיל, מוכנים לקבל בקשות.
  • SERVICE: שם השירות.
  • REGION: Google Cloud האזור של השירות.
  • PROJECT-ID: מזהה הפרויקט ב- Google Cloud .

הצגת מקרים מינימליים ברמת השירות

כדי לראות את ההגדרות הנוכחיות של מספר המינימום של מופעים ברמת השירות בשירות Cloud Run:

המסוף

  1. נכנסים לדף Services של Cloud Run במסוף Google Cloud :

    כניסה ל-Cloud Run

  2. לוחצים על השירות שרוצים לראות כדי לפתוח את החלונית פרטי השירות.

  3. ההגדרה הנוכחית מוצגת בפינה השמאלית העליונה של החלונית עם פרטי השירות, לצד Scaling.

gcloud

  1. משתמשים בפקודה הבאה:

    gcloud run services describe SERVICE
  2. מחפשים את הערך של Scaling: Auto (Min: MIN_VALUE, Max: MAX_VALUE) בהגדרה שמוחזרת.

הגדרת מספר מינימלי של מופעים ברמת השינוי

כל שינוי בהגדרות מוביל ליצירה של גרסה חדשה. גם גרסאות מתוקנות עתידיות יקבלו את הגדרת התצורה הזו באופן אוטומטי, אלא אם תבצעו עדכונים מפורשים כדי לשנות אותה.

כברירת מחדל, האפשרות min-instances מושבתת במופעים של מאגרי תגים, וההגדרה היא 0. אפשר לשנות את ברירת המחדל הזו באמצעות מסוף Google Cloud , Google Cloud CLI או קובץ YAML כשיוצרים שירות חדש או פורסים עדכון חדש:

המסוף

  1. נכנסים ל-Cloud Run במסוף Google Cloud :

    כניסה ל-Cloud Run

  2. בתפריט הניווט של Cloud Run, בוחרים באפשרות Services (שירותים) ולוחצים על Deploy container (פריסת קונטיינר) כדי להגדיר שירות חדש. אם אתם מגדירים שירות קיים, לוחצים על השירות ואז על עריכה ופריסה של עדכון חדש.

  3. אם אתם מגדירים שירות חדש, ממלאים את דף ההגדרות הראשוניות של השירות ואז לוחצים על Containers, Networking, Security (מאגרי נתונים, רשתות, אבטחה) כדי להרחיב את דף הגדרות השירות.

  4. לוחצים על הכרטיסייה מאגר תגים.

    תמונה

    • בשדה עם התווית Minimum number of instances (מספר המופעים המינימלי), מציינים את מספר מופעי הקונטיינרים שצריך לשמור במצב מוכן לקבלת בקשות.
  5. לוחצים על יצירה או על פריסה.

gcloud

כדי לעדכן min-instance של שירות מסוים, משתמשים בפקודה הבאה:

gcloud run services update SERVICE --min-instances MIN-VALUE

מחליפים את מה שכתוב בשדות הבאים:

  • SERVICE: השם של השירות.
  • MIN-VALUE: מספר מופעי הקונטיינרים שצריך לשמור במצב מוכן לקבלת בקשות. מציינים default כדי לנקות את ההגדרה של ערך מינימלי של מופעים.

אפשר גם להגדיר את min-instance במהלך הפריסה באמצעות הפקודה:

gcloud run deploy --image IMAGE_URL --min-instances MIN-VALUE

מחליפים את מה שכתוב בשדות הבאים:

  • IMAGE_URL: הפניה לקובץ אימג' של קונטיינר, לדוגמה, us-docker.pkg.dev/cloudrun/container/hello:latest. אם אתם משתמשים ב-Artifact Registry, צריך ליצור מראש את המאגר REPO_NAME. כתובת ה-URL היא בפורמט LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG .
  • MIN-VALUE: מספר מופעי הקונטיינרים שצריך לשמור במצב מוכן לקבלת בקשות. מציינים default כדי לנקות את ההגדרה של ערך מינימלי של מופעים.

YAML

  1. אם אתם יוצרים שירות חדש, דלגו על השלב הזה. כדי לעדכן שירות קיים, מורידים את הגדרות ה-YAML שלו:

    gcloud run services describe SERVICE --format export > service.yaml
  2. מעדכנים את המאפיין autoscaling.knative.dev/minScale::

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            autoscaling.knative.dev/minScale: 'MIN-INSTANCE'
          name: REVISION

    מחליפים את מה שכתוב בשדות הבאים:

    • SERVICE: השם של שירות Cloud Run
    • MIN-INSTANCE: מספר המופעים שצריך לשמור במצב פעיל, מוכנים לקבל בקשות.
    • REVISION עם שם חדש לגרסה או למחוק אותה (אם היא קיימת). אם מספקים שם חדש לגרסה, חובה שהוא יעמוד בקריטריונים הבאים:
      • מתחיל ב-SERVICE-
      • מכיל רק אותיות קטנות, מספרים ו-
      • לא מסתיים ב--
      • לא חורג מ-63 תווים
  3. יוצרים או מעדכנים את השירות באמצעות הפקודה הבאה:

    gcloud run services replace service.yaml

    אם קיים קובץ service.yaml, הפקודה gcloud run services replace משתמשת בו כברירת מחדל.

Terraform

כדי ללמוד איך להחיל הגדרות ב-Terraform או להסיר אותן, ראו פקודות בסיסיות ב-Terraform.

מוסיפים את הטקסט הבא למשאב google_cloud_run_v2_service בקובץ התצורה של Terraform:

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-min-instances"
  location = "us-central1"

  deletion_protection = false # set to "true" in production

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    scaling {
      # Min instances
      min_instance_count = 1
    }
  }
}

במשאב google_cloud_run_v2_service שלמעלה מצוין מספר מינימלי של מופעים של 1 ב-template.scaling. מחליפים את 1 במספר המינימלי של המכונות שאתם רוצים.

הצגת מופעי מינימום ברמת השינוי

כדי לראות את ההגדרות הנוכחיות של מספר המינימום של מופעים ברמת התיקון בשירות Cloud Run:

המסוף

  1. נכנסים לדף Services של Cloud Run במסוף Google Cloud :

    כניסה ל-Cloud Run

  2. לוחצים על השירות שרוצים לראות כדי לפתוח את החלונית פרטי השירות.

  3. לוחצים על הכרטיסייה עדכונים.

  4. בחלונית הפרטים שמשמאל, ההגדרה Revision min. instances מופיעה בכרטיסייה Container.

gcloud

  1. משתמשים בפקודה הבאה:

    gcloud run services describe SERVICE
  2. מחפשים את הערך של Min instances:‎ בהגדרה שמוחזרת.

דוגמאות

בקטעים הבאים מוסבר איך השירות מתנהג כשמגדירים מספר מינימלי של מופעים.

שימוש במינימום או במקסימום מופעים ברמת השירות וברמת הגרסה

בטבלה הבאה מוצג אופן הפעולה אם משלבים בין מספר מינימלי או מקסימלי של מופעים ברמת השירות לבין מספר מינימלי או מקסימלי של מופעים ברמת הגרסה. שימו לב שאם יש סתירה בין שתי ההגדרות, ההגדרה של מספר המופעים המקסימלי מגבילה את ההגדרה של מספר המופעים המינימלי ומבטלת אותה.

הגדרת תצורה התנהגות
הוגדרו גם מקרים מינימליים ברמת שירות וגם מקרים מינימליים ברמת עדכון. הערך האפקטיבי של הגרסה הוא הגדול מבין הערכים של המופעים המינימליים ברמת הגרסה והמופעים המינימליים ברמת השירות.
הוגדרו גם מקרים מינימליים ברמת השירות וגם מקרים מקסימליים ברמת הגרסה. הערך האפקטיבי של הגרסה הוא הקטן מבין המופעים המקסימליים ברמת הגרסה והמופעים המינימליים ברמת השירות.

זה נכון גם אם מספר המכונות המקסימלי ברמת הגרסה מונע מהשירות להגיע למספר המכונות המינימלי שהוגדר ברמת השירות.
הערך של 'מספר מקסימלי של מופעי שירות' קטן מהערך של 'מספר מינימלי של מופעים' של עדכון. הערך האפקטיבי של המופעים של השינוי מוגבל למקסימום של השירות.
הערך של 'מספר מינימלי של מופעים של שירות' גדול מהערך של 'מספר מקסימלי של מופעים' של עדכון. הערך האפקטיבי של המופעים של הגרסה מוגבל למקסימום של הגרסה.

שימוש במספר מינימלי של מופעים ברמת השירות עם חלוקת תנועה

אם משתמשים בפיצול תנועה, המינימום של המופעים ברמת השירות מחולק בין הגרסאות בהתאם לחלק היחסי של פיצול התנועה. לדוגמה, אם המינימום של רמת השירות instances = 10, פיצול תנועה של 50/50 מקצה 5 מופעים מינימליים של רמת השירות לכל עדכון.

בטבלה הבאה מוצגים תרחישי הגדרה לדוגמה:

תרחיש שימוש לדוגמה הגדרה לדוגמה התנהגות שמתקבלת
אין הגדרות ברמת השינוי מספר המינימום של מופעים ברמת השירות: 10
  • מספר מכונות מינימלי בגרסה א': 0
  • מספר המכונות המינימלי לגרסה ב': 0
  • חלוקת התנועה: 60/40
גרסה א' מקבלת 6 מופעים מתוך המינימום של המופעים ברמת השירות, באופן יחסי לחלוקת התנועה. גרסה ב' מקבלת 4 מופעים ממינימום המופעים ברמת השירות, באופן יחסי לפי חלוקת התנועה.
מקבלים יותר מהמינימום של המופעים ברמת השירות בגלל המינימום של המופעים ברמת הגרסה מספר המינימום של מופעים ברמת השירות: 10
  • מינימום מכונות בגרסה A: ‏ 6
  • מספר המכונות המינימלי לגרסה ב': 0
  • חלוקת התנועה: 50/50
גרסה א' מקבלת 6 מופעים מהמספר המינימלי של מופעים ברמת הגרסה. גרסה ב' מקבלת 5 מופעים ממינימום המופעים ברמת השירות, באופן יחסי לחלוקת התנועה. המספר הזה חורג מהמספר המינימלי של מופעים ברמת השירות, וזו הכוונה.
מקבלים פחות ממינימום המופעים ברמת השירות בגלל מקסימום המופעים ברמת השינוי. מספר המינימום של מופעים ברמת השירות: 10
  • מספר מכונות מינימלי בגרסה א': 0
  • מספר מכונות מקסימלי לגרסה A: ‏ 3
  • מספר המכונות המינימלי לגרסה ב': 0
  • חלוקת התנועה: 50/50
גרסה א' מקבלת 3 מופעים מהמופעים המינימליים ברמת השירות שנובעים מחלוקת התנועה, אבל היא מוגבלת למופעים המקסימליים ברמת הגרסה שלה.
גרסה ב' מקבלת 5 מופעים מהמופעים המינימליים ברמת השירות, באופן יחסי לחלוקת התנועה. התוצאה היא 8 מופעים ברמת השירות, כי 2 מופעים אבדו בגלל המקסימום של מופעים ברמת העדכון של עדכון A.
המספר המינימלי של מופעים ברמת השירות גדול ממספר הגרסאות בחלוקת התנועה, ויש כמות חלקית של מופעים שפרופורציונלית לחלוקת התנועה מינימום מכונות ברמת השירות: 3 גרסה א' מקבלת מכונה אחת לפחות וגרסה ב' מקבלת 2 מכונות לפחות. ספירת המופעים של השירות היא 3.

קביעת מספר המופעים המינימלי שנדרש

אם הערך של minimum instances (מספר מופעים מינימלי) גבוה יותר ממה שנדרש לתנועת הגולשים הרגילה, יכול להיות שהרבה מופעים יהפכו לפעילים באופן חלקי, וכל אחד מהם יעבד כמה בקשות. לדוגמה, אם בדרך כלל השירות שלכם דורש 200 מופעים לשיא העומס, אבל הגדרתם 600 מופעים מינימליים, הבקשות הנכנסות יתחלקו בין כל 600 המופעים. כתוצאה מכך, הרבה מתוך 600 המכונות האלה הופכות לפעילות במידה מסוימת, וכל אחת מהן מטפלת בחלק קטן מתעבורת הנתונים, במקום ש-200 מכונות יהיו פעילות מאוד ו-400 הנותרות יישארו בלי פעילות לחלוטין.

כדי לצמצם את העלויות (על ידי ניצול גבוה יותר של פחות מקרים), צריך להגדיר את מספר המקרים המינימלי לערך שקרוב למספר המקרים בפועל שנדרשים כדי לטפל בתנועה הרגילה.

בנוסף, כשמכונות נוספות מוקצות באמצעות התאמה אוטומטית לעומס מעבר למספר המינימלי של המכונות שהוגדר, מערכת Cloud Run מעדיפה להפנות בקשות נכנסות קודם למספר המינימלי של המכונות שהוגדר, ורק אחר כך לשלוח בקשות למכונות שהוקצו באמצעות התאמה אוטומטית לעומס. בחיוב לפי בקשה, הניתוב המועדף הזה למופעים המינימליים שהוגדרו מפחית את העלויות, כי המערכת משתמשת במופעים המינימליים שהוגדרו לפני שהיא משתמשת במופעים שגודלם משתנה אוטומטית. שימו לב: הניתוב המועדף הזה יכול גם להוביל לניצול גבוה יותר של מופעים מינימליים שהוגדרו בהשוואה למופעים שניתנים להרחבה אוטומטית, בהתאם לכמות התנועה.