בדף הזה מפורטות המכסות והמגבלות שחלות על השימוש ב-Cloud Run.
מספר המשאבים ב-Cloud Run מוגבל. המכסות של Cloud Run כוללות מגבלות על קצב השימוש ב-API, שמשפיעות על הקצב שבו אפשר להפעיל את Cloud Run Admin API.
אין הגבלה ישירה לגבי:
- הגודל של קובצי אימג' בקונטיינרים שאפשר לפרוס.
- מספר הבקשות המקבילות שמטופלות על ידי שירות Cloud Run.
מגבלות משאבים ב-Cloud Run
כדי לחרוג מהמגבלות שאפשר להגדיל, מבקשים להגדיל את המכסה. כדי לחרוג מהמגבלות לכל פרויקט שלא ניתן להגדיל, צריך ליצור משאבים חדשים בפרויקט או באזור אחר. Google Cloud
| משאב | תיאור | הגבלה | היקף | אפשר להגדיל את המכסה |
|---|---|---|---|---|
| שירות | מספר השירותים המקסימלי | 1000 | לכל פרויקט ואזור | לא |
| משימה | מספר המשימות המקסימלי | 1000 | לכל פרויקט ואזור | לא |
| מאגר עובדים | מספר מקסימלי של מאגרי עובדים | 1000 | לכל פרויקט ואזור | לא |
| הרצת משימה | מספר מקסימלי של הפעלות של משימות | 1000 | לכל פרויקט ואזור | לא |
| גרסה קודמת | מספר הגרסאות המקסימלי לכל שירות. כשמגיעים למגבלה, גרסאות שלא מוצגות נמחקות אוטומטית לפי סדר היסטורי | 1000 | לכל שירות | לא |
| גרסה קודמת | המספר המקסימלי של גרסאות שמוצגות למשתמשים | 4000 | לכל פרויקט ואזור | לא |
| תג גרסה | המספר המקסימלי של תגי גרסה. אם חורגים ממגבלת התגים של הגרסה, Cloud Run מבצע ניקוי של התגים בשירות. בשירות שעבורו נוצר תג חדש, תגים שלא צוין עבורם אחוז תנועה נמחקים אוטומטית לפי סדר היסטורי. | 2000 | לכל פרויקט ואזור | לא |
| הרצת משימה | מגבלת השמירה של ביצועים של משימות שהושלמו. כשהמספר של ההרצות שהושלמו של משימה מגיע למגבלה הזו, ההרצות נמחקות אוטומטית לפי סדר היסטורי. | 1,000 | לכל משרה | לא |
| משימת הרצת עבודה1 | המספר המקסימלי של משימות שפועלות במקביל | תלוי באזור שנבחר ובהגדרות של המעבד והזיכרון. יכול להיות שהמגבלה הזו תהיה גבוהה יותר באזורים עם קיבולת גבוהה, או נמוכה יותר באזורים שנפתחו לאחרונה. אפשר לראות את המכסה בדף Quotas and system limits במסוף. | לכל הרצת משימה | כן |
| משימת הרצת משימה | הערך המקסימלי של הזמן הקצוב לתפוגה של משימות | 168 שעות (7 ימים), או שעה אחת אם משתמשים ב-GPU | לכל הרצת משימה | לא |
| משימת הרצת משימה | מספר המשימות המקסימלי בעבודה אחת | 10,000 | לכל הרצת משימה | לא |
| משימת הרצת משימה | המספר המקסימלי של ניסיונות חוזרים למשימה בעבודה | 10 | לכל הרצת משימה | לא |
| משתני סביבה | המספר המקסימלי של משתני סביבה לכל קונטיינר | 1000 | לכל משרה או לכל שירות | לא |
| ארגומנטים של פקודות | מספר ארגומנטים מקסימלי לפקודה לכל מאגר | 1000 | לכל משרה או לכל שירות | לא |
| מופע של מאגר תגים3 | מספר מקסימלי של מופעי קונטיינרים שמשתמשים ביציאה ישירה מ-VPC | 100-200, בהתאם להגדרות של האזור שנבחר. | לכל גרסה ולאזור | כן |
| מופע של מאגר | זמן קצוב לתפוגה של Startup, בדקות | 4 | לכל מופע של קונטיינר | לא |
| זיכרון | גודל הזיכרון המקסימלי ב-GiB | 32 | לכל מופע של קונטיינר | לא |
| CPU | מספר מקסימלי של vCPU | 8 | לכל מופע של קונטיינר | לא |
| CPU1 | סך המעבדים (CPU) המקסימליים, במילי-מעבדים וירטואליים, שהוקצו לכל המופעים במהלך תקופה של דקה אחת. | תלוי באזור שנבחר. יכול להיות שהמגבלה הזו תהיה גבוהה יותר באזורים עם קיבולת גבוהה, או נמוכה יותר באזורים שנפתחו לאחרונה. | לכל פרויקט ואזור | כן |
| זיכרון1 | הזיכרון הכולל המקסימלי, בבייטים, שהוקצה לכל המופעים במשך תקופה של דקה אחת. | תלוי באזור שנבחר. יכול להיות שהמגבלה הזו תהיה גבוהה יותר באזורים עם קיבולת גבוהה, או נמוכה יותר באזורים שנפתחו לאחרונה. אפשר לראות את המכסה בדף Quotas and system limits במסוף. | לכל פרויקט ואזור | כן |
| מופע GPU ללא הבטחה של יתירות אזורית1, 4 | מספר מקסימלי של מופעי מאגר עם GPU | 04 | לכל פרויקט לכל אזור | כן |
| מופע GPU עם הבטחה ליתירות אזורית1, 4 | מספר מקסימלי של מופעי מאגר עם GPU | 04 | לכל פרויקט לכל אזור | כן |
| דיסק | הגודל המקסימלי של מערכת קבצים בזיכרון שאפשר לכתוב אליה, מוגבל על ידי זיכרון המופע, ב-GiB | 32 | לכל מופע של קונטיינר | לא |
| משתנה הסביבה | אורך משתנה מקסימלי, ב-Kb | 32 | לכל משתנה | לא |
| מיפוי דומיינים | מספר אישורי ה-SSL המקסימלי | 50 | לכל דומיין ברמה העליונה ולכל שבוע | לא |
| מיפוי דומיינים | מספר מקסימלי של אישורי SSL כפולים | 5 | לכל דומיין מוביל ולכל שבוע | לא |
| טוקן גישה | מספר מקסימלי של טוקני גישה ייחודיים שנוצרו | 50 | לכל מופע של קונטיינר לשנייה | לא |
| טוקן זהות | מספר מקסימלי של אסימוני זהות ייחודיים שנוצרו | 50 | לכל מופע של קונטיינר לשנייה | לא |
| קבצים שנפתחו | המספר המקסימלי של קבצים שאפשר לפתוח בו-זמנית. תואם ל-/proc/sys/fs/file-max. |
25000 | לכל מופע של קונטיינר | לא |
1המכסות האזוריות האלה משמשות בכמה מקרים שבהם כל אחת מהן שולטת ב:
הערך המקסימלי שאפשר לבחור למאפיין המופע המקסימלי של גרסה. אחרי שהיא מאושרת באזור מסוים, כל השינויים באזור הזה יכולים להגיע למגבלה שאושרה.
המקביליות המקסימלית של משימה. אחרי שההרשאה ניתנת באזור מסוים, כל המשימות באותו אזור יכולות להגיע למגבלה שהוגדרה.
מספר מופעי הקונטיינרים הכולל להרצת ביצועים של משימות באזור מסוים.
3 המכסה האזורית הזו משמשת בכמה מקרים:
הוא קובע את הערך המקסימלי שאפשר לבחור למאפיין maximum instance של גרסה באמצעות יציאה ישירה מ-VPC. אחרי שהיא מאושרת באזור מסוים, כל השינויים באזור הזה יכולים להגיע למגבלה שאושרה.
הוא קובע את ההפעלה המקבילית המקסימלית של משימה באמצעות יציאה ישירה מ-VPC. אחרי שההרשאה ניתנת באזור מסוים, כל המשימות באותו אזור יכולות להגיע למגבלה שנקבעה.
4 בפרויקטים חדשים שיוצרים שירות עם יחידות GPU מסוג L4, יוקצו אוטומטית 3 יחידות NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. אפשר גם לבקש מכסה של NvidiaL4GpuAllocPerProjectRegion או של NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. אם השימוש המקסימלי במעבד ה-GPU לא קרוב למכסה, יכול להיות ש-Google תקטין את המכסה.
מגבלות של Cloud Run בנושא רשת
מגבלות של בקשות ל-Cloud Run
| תיאור | הגבלה | הערות |
|---|---|---|
| מספר מקסימלי של בקשות בו-זמנית לכל מופע | 1000 | |
| מספר מקסימלי של שידורים בו-זמניים לכל חיבור לקוח HTTP/2 | 100 | |
| הזמן המקסימלי לפני פסק זמן לכל בקשה | 60 דקות | |
| גודל בקשה מקסימלי ב-HTTP/1 | 32MiB אם משתמשים בשרת HTTP/1. אין הגבלה אם משתמשים בשרת HTTP/2. | |
| גודל מקסימלי של תגובת HTTP/1 | 32 MiB אם לא משתמשים ב-Transfer-Encoding: chunked או במנגנוני סטרימינג |
|
| מספר החיבורים הפתוחים המקסימלי לכל מכונה לכל סוג תעבורת נתונים יוצאת (אינטרנט או VPC) | 50000 | לא חל על תנועת יציאה ישירה מ-VPC. |
| חיבורים יוצאים לשנייה לכל מכונה | 700 | לא חל על תעבורת יציאה ישירה מ-VPC שנשלחת לרשת ה-VPC, שלא מוגבלת. |
| חיבורים יוצאים בדקה לכל מופע | 5,000 | לא חל על תעבורת יציאה ישירה מ-VPC שנשלחת לרשת ה-VPC, שלא מוגבלת. |
| רזולוציות DNS יוצאות לשנייה לכל מופע | 1000 | |
| בקשות נכנסות לשנייה ליציאת קונטיינר HTTP/1 לכל מופע | 800 | ההגדרה לא חלה על יציאות של מאגרי HTTP/2. |
מגבלות רוחב פס ב-Cloud Run
מכונות Cloud Run כפופות למגבלות רוחב הפס הבאות:
| תיאור | הגבלה | הערות |
|---|---|---|
| מספר הביטים המקסימלי לכל מופע עבור תעבורת נתונים יוצאת (egress) דרך Direct VPC | 1 Gbps | תעבורה יוצאת (egress) דרך תעבורה יוצאת ישירה (direct egress) מ-VPC ליעדים ברשת ה-VPC. |
| מספר הביטים המקסימלי לכל מופע, לא כולל תעבורת נתונים יוצאת (egress) דרך Direct VPC | 600 Mbps | על סמך סכום הסיביות של תעבורת הנתונים הנכנסת (ingress) והיוצאת (egress), לא כולל תעבורת נתונים יוצאת (egress) דרך תעבורת נתונים יוצאת (egress) ישירה של VPC ליעדים ברשת ה-VPC. |
| קצב החבילות הכולל המקסימלי לכל מכונה, לא כולל תעבורת נתונים יוצאת (egress) דרך Direct VPC | 64,000 חבילות לשנייה | על סמך סכום החבילות הנכנסות והחבילות היוצאות, לא כולל חבילות יוצאות דרך Direct VPC ליעדים ברשת ה-VPC. |
אם תגיעו לאחת משתי המגבלות, רוחב הפס של מכונת Cloud Run יהיה מוגבל.
מגבלות קצב של Cloud Run Admin API
מגבלות הקצב הבאות חלות על Cloud Run Admin API. הם לא חלים על הבקשות שמגיעות לשירותי Cloud Run שפרסתם.
| מכסה | תיאור | הגבלה | אפשר להגדיל את המכסה | היקף |
|---|---|---|---|---|
| בקשות קריאה של Cloud Run Admin API | מספר הקריאות ל-API לכל 60 שניות בכל אזור. זה לא מספר בקשות הקריאה לשירותי Cloud Run, שלא מוגבל. | 3,000 ל-60 שניות | כן | לכל פרויקט ואזור |
| בקשות כתיבה ל-Cloud Run Admin API | מספר הכתיבות בAPI לכל 60 שניות בכל אזור. זה לא מספר בקשות הכתיבה לשירותי Cloud Run, שלא מוגבל. | 180 ל-60 שניות | כן | לכל פרויקט ואזור |
| הפעלת משימה | המספר המקסימלי של פעמים שאפשר להריץ משימה בכל אזור בכל 60 שניות. | 180 ל-60 שניות | כן | לכל פרויקט ואזור |
איך מגדילים את המכסה
בקשות להתאמת מכסות ב-Cloud כפופות לבדיקה. אם הבקשה לשינוי המכסה דורשת בדיקה, תקבלו אימייל עם אישור על קבלת הבקשה. אם דרושה לך עזרה נוספת, אפשר להשיב לאימייל הזה. אחרי שנבדוק את הבקשה, תקבלו התראה באימייל לגבי אישור הבקשה. אפשר לבקש שינוי במכסה באמצעות מסוף Google Cloud , Cloud Quotas API או Google Cloud CLI. בהוראות הבאות מוסבר איך לבקש ערך מכסה חדש באמצעות מסוף Google Cloud או באמצעות בקשת REST ל-Cloud Quotas API. Google Cloud
המסוף
כדי לבקש שינוי במכסה, פועלים לפי השלבים הבאים:
במסוף Google Cloud , נכנסים לדף IAM & Admin > Quotas & System Limits:
אם מתבקשים לבחור פרויקט, בוחרים את הפרויקט שרוצים לשנות.מחפשים את המכסה שרוצים לשנות ופותחים את תיבת הדו-שיח Quota changes (שינויים במכסה):
מיכסות שלא מופיעות בטבלה:
- מחפשים את המכסה בתיבת החיפוש Filter. לא מציינים את האזור או האזור (אם רלוונטי) כי מכסות שלא נעשה בהן שימוש או שלא הותאמו לא מוצגות בטבלה.
- מחפשים בטבלה את הערך של המכסה. זה יכול להיות הערך שמוגדר כברירת מחדל או כל ערך עם היסטוריה, בלי קשר לאזור או לאזור הזמן.
- בשורה של הרשומה, לוחצים על סמל האפשרויות הנוספות > הגדרת אזורים נוספים.
- בוחרים את האזור או את האזור שרוצים לשנות. לוחצים על Edit.
כל שאר המכסות:
- מחפשים את המכסה בתיבת החיפוש Filter.
- בשורה של הרשומה, מסמנים את התיבה של המכסה.
- לוחצים על עריכה.
תיבת הדו-שיח Quota changes מופיעה.
אם מופיע קישור לבקשה להגדלת המכסה מעל השדה ערך חדש ואתם רוצים להגדיל את ערך המכסה מעבר למספר שמצוין במסך, לוחצים על הקישור. ממלאים את הטופס, שולחים אותו ומדלגים על שאר השלבים שבהמשך. אחרת, ממשיכים לפעול לפי ההוראות במדריך הזה.
בשדה New value, מזינים את ערך המכסה המוגדל שרוצים. אם מופיע השדה Request description, מזינים תיאור. לוחצים על סיום.
- אם מוצגת תיבת סימון עם הטקסט "ברור לי שהבקשה הזו תסיר את כל החריגות", ערך המכסה מוגדר מתחת לערך ברירת המחדל. שינוי ערך המכסה לערך ברירת המחדל או לערך שגבוה ממנו יגרום להסרת השינוי מברירת המחדל. כדי להמשיך, מסמנים את תיבת הסימון. מידע נוסף על ביטול מכסות
אם מופיע לחצן הבא, לוחצים עליו וממלאים את הפרטים ליצירת קשר במסך הבא.
לוחצים על Submit request.
אם אי אפשר לבקש לשנות מכסה במסוף, תוכלו לשלוח את הבקשה ל-Cloud Customer Care.
במאמר מידע על שינויים במכסות מוסבר בהרחבה על התהליך של הגדלת מכסות.
קיבוץ בקשות לשינוי מכסות
כדי לשלוח בקשות לשינוי מכסות בקבוצות, מסמנים את תיבת הסימון של כל מכסה שרוצים לכלול. עם זאת, שליחת בקשות באצווה עלולה להאריך את הזמן שיידרש ל- Google Cloud כדי לבדוק את הבקשה.
כדי לקצר את זמן הבדיקה, כדאי לקבץ את הבקשות לשינוי מכסות לפי מוצר ותחום. לדוגמה, אם רוצים לבקש שינויים במכסות של רשתות ובמכסות של מכונות וירטואליות ב-Compute Engine, צריך ליצור בקשה אחת למכסות של רשתות ובקשה נוספת למכסות של מכונות וירטואליות ב-Compute Engine.
REST
כדי לבקש שינוי במכסות דרך Cloud Quotas API, משתמשים בדוגמת הקוד הבאה. ממלאים את ה-placeholders שניתנים לעריכה בערכים שלכם. כדי לקבל מידע על שדות placeholder, אפשר לעיין בתיאורים שמופיעים אחרי דוגמת הקוד.
POST projects/PROJECT_NUMBER/locations/global/quotaPreferences?quotaPreferenceId=QUOTA_PREFERENCE_ID { "service": "SERVICE_ID", "quotaId": "QUOTA_ID", "quotaConfig": { "preferredValue": "NEW_QUOTA_VALUE" }, "dimensions": { "DIMENSION_1": "VALUE_1", "DIMENSION_2": "VALUE_2" }, "justification": "JUSTIFICATION", "contactEmail": "EMAIL" }
מחליפים את מה שכתוב בשדות הבאים:
PROJECT_NUMBER: מספר הפרויקט ב- Google Cloud . אפשר לראות את מספר הפרויקט בדף Welcome במסוף Google Cloud או להריץ את הפקודה הבאה ב-CLI של gcloud:PROJECT=$(gcloud info --format='value(config.project)') gcloud projects describe ${PROJECT} --format="value(projectNumber)"
QUOTA_PREFERENCE_ID: המזהה של העדפת הקוֹטָה שאתם רוצים לעדכן.
QUOTA_ID: המזהה של המכסה שרוצים לעדכן.
SERVICE_ID: המזהה של Google Cloud שאליו שייכת המכסה שרוצים לשנות. בדרך כלל זהו שם מהצורהSERVICE_NAME.googleapis.com. לדוגמה, שם השירות של Compute Engine הואcompute.googleapis.com.
DIMENSION_1: סוג המאפיין שרוצים לשנות – לדוגמה,regionאוzone. אפשר לכלול כמה מאפיינים. מפרידים בין כל מאפיין באמצעות פסיק אחרי הערך שלו – לדוגמה,VALUE_1. כדי לשנות את כל המאפיינים של המכסה, משמיטים את השורה הזו.
VALUE_1: הערך של המאפיין הקודם. לדוגמה, אם המאפיין הקודם הואregion, מזינים אזור כמוus-central1.JUSTIFICATION: הסיבה לבקשה.
EMAIL: כתובת אימייל שאפשר להשתמש בה ככתובת ליצירת קשר, למקרה ש Google Cloud יצטרך מידע נוסף כדי לקבל החלטה לפני אישור מכסת שימוש נוספת.
דוגמה לבקשה
הדוגמה הבאה מציגה בקשה להגדלת ערך המכסה של Compute Engine PUS-PER-GPU-FAMILY-per-project-region. הבקשה היא להקצאת ערך מכסה של 100 למכונות ממשפחת ה-GPU NVIDIA_H100 שנמצאות באזור us-central1.
POST projects/123/locations/global/quotaPreferences?quotaPreferenceId=my_quota_preference_ID {
"service": "compute.googleapis.com",
"quotaId": "GPUS-PER-GPU-FAMILY-per-project-region",
"quotaConfig": { "preferredValue": 100 },
"dimensions": { "region": "us-central1", "gpu_family": "NVIDIA_H100" },
"justification": "My justification.",
"contactEmail": "222larabrown@gmail.com"
}