בעיות מוכרות ב-GKE ב-AWS

בדף הזה מפורטות בעיות ידועות נבחרות ב-GKE ב-AWS, וגם שלבים שאפשר לבצע כדי לצמצם את ההשפעה שלהן.

כדי לסנן את הבעיות הידועות לפי גרסת מוצר או קטגוריה, בוחרים את המסננים מהתפריטים הנפתחים הבאים.

אם אתם משתתפים ב-Google Developer Program, כדאי לשמור את הדף הזה כדי לקבל התראות כשמתפרסם הערת גרסה שקשורה לדף הזה. מידע נוסף זמין במאמר בנושא דפים שמורים.

בוחרים את הגרסה של GKE ב-AWS:

בוחרים את קטגוריית הבעיה:

אפשר גם לחפש את הבעיה:

קטגוריה הגרסאות שזוהו הבעיה והפתרון העקיף
תפעול

‫1.28.0-gke.0 עד 1.28.8-gke.800 (לא כולל),

‫1.27.0-gke.0 עד 1.27.12-gke.800 (לא כולל),

‫1.26, ‏ 1.25, ‏ 1.24, ‏ 1.23, ‏ 1.22

המידרוג האוטומטי של האשכול לא מבצע הגדלה מאפס צמתים במאגרי צמתים עם תוויות או כתמים מותאמים אישית.

הבעיה הזו מתרחשת כי המידרוג האוטומטי של אשכול GKE ב-AWS לא הגדיר את התוויות של מאגר הצמתים ואת תגי ה-taint בקבוצת המידרוג האוטומטי של מאגר הצמתים המתאים במהלך הקצאת מאגר הצמתים. במאגרי צמתים עם אפס צמתים, המידרוג האוטומטי של האשכול לא יכול ליצור את תבניות הצמתים בצורה תקינה בגלל התגים החסרים האלה. זה עלול להוביל להחלטות שגויות לגבי שינוי גודל, כמו תרמילים שלא מתוזמנים לצמתים הרלוונטיים, או הקצאת צמתים שלא באמת נדרשים.

מידע נוסף מופיע במאמר בנושא הגדרה של גילוי אוטומטי.

Networking

‫1.26.0-gke.0 עד 1.26.4-gke.220 (לא כולל),

‫1.25.0-gke.0 עד 1.25.10-gke.1200 (לא כולל),

‫1.24 החל מגרסה 1.24.0-gke.0,

‫1.23 החל מ-1.23.8-gke.1700

אשכולות שפועלים במערכת הפעלה Ubuntu שמשתמשת בליבה בגרסה 5.15 ואילך חשופים לכשלים בהוספה של טבלת מעקב אחר חיבורים (conntrack) של netfilter. כשלים בהוספה יכולים לקרות גם כשיש מקום לערכים חדשים בטבלת מעקב החיבורים. הכשלים נגרמים בגלל שינויים בגרסה 5.15 של ליבת המערכת ומגרסאות מתקדמות יותר, שמגבילים את ההוספות לטבלה על סמך אורך השרשרת.

כדי לבדוק אם הבעיה משפיעה עליכם, מריצים את הפקודה הבאה כדי לבדוק את הסטטיסטיקות של מערכת המעקב אחר חיבורים בתוך ליבת המערכת:

    sudo conntrack -S
    

התגובה אמורה להיראות כך:

cpu=0       found=0 invalid=4 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=1       found=0 invalid=0 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=2       found=0 invalid=16 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=3       found=0 invalid=13 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=4       found=0 invalid=9 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=5       found=0 invalid=1 insert=0 insert_failed=0 drop=0 early_drop=0
error=519 search_restart=0 clash_resolve=126 chaintoolong=0
    

אם ערך chaintoolong בתשובה הוא מספר שאינו אפס, סימן שהבעיה משפיעה עליכם.

פתרון עקיף:

אם אתם מריצים את גרסה 1.26.2-gke.1001, אתם צריכים לשדרג לגרסה 1.26.4-gke.2200 ומעלה.

נוחות השימוש ‫1.25.5-gke.1500, ‏ 1.25.4-gke.1300

חלק מהמשטחים בממשק המשתמש של Google Cloud המסוף לא יכולים לקבל הרשאה לאשכול, ויכול להיות שהאשכול יוצג כלא נגיש.

פתרון עקיף:

משדרגים את האשכול לתיקון האחרון שזמין לגרסה 1.25. הבעיה הזו תוקנה בגרסה 1.25.5-gke.2000.

נוחות השימוש 1.22

ב-Kubernetes 1.22, כמה ממשקי API הוצאו משימוש והוחלפו. אם שדרגתם את האשכול לגרסה 1.22 ואילך, כל קריאה שהאפליקציה מבצעת לאחד ממשקי ה-API שהוצאו משימוש תיכשל.

פתרון עקיף:

צריך לשדרג את האפליקציה כדי להחליף את הקריאות ל-API שיצא משימוש בגרסאות חדשות יותר.

לקבלת עזרה נוספת, אפשר לפנות אל Cloud Customer Care.