פתרון בעיות בעומסי עבודה של Arm

בדף הזה מוסבר איך לפתור בעיות בעומסי עבודה של Arm שנפרסו באשכולות Autopilot או Standard של Google Kubernetes Engine ‏ (GKE).

קריסה של Pods בצמתי Arm

הבעיה הבאה מתרחשת כשפורסים Pod בצומת Arm, אבל קובץ אימג' של קונטיינר לא נוצר לארכיטקטורת Arm.

כדי לזהות את הבעיה:

  1. בודקים את הסטטוס של הפודים:

    kubectl get pods
    
  2. כדי לקבל את היומנים של Pod שקורס:

    kubectl logs POD_NAME
    

    מחליפים את POD_NAME בשם של ה-Pod שקורס.

    הודעת השגיאה ביומני ה-Pod דומה להודעה הבאה:

    exec ./hello-app: exec format error
    

כדי לפתור את הבעיה, צריך לוודא שקובץ אימג' של קונטיינר תומך בארכיטקטורת Arm. מומלץ ליצור כמה תמונות של הארכיטקטורה.

ה-Pod לא מפעיל הגדלה

הכלל חל על: Autopilot

הבעיה הבאה מתרחשת באשכולות במצב Autopilot כשמנסים לפרוס עומסי עבודה של Arm בגרסאות GKE שלא נתמכות או בGoogle Cloud אזורים שלא נתמכים.

כדי לזהות את הבעיה, צריך לקבל את יומן האירועים של האשכול:

kubectl get events -w

הפלט אמור להיראות כך:

117s        Normal    NotTriggerScaleUp   pod/hello-app2-78fc858558-pg4hz   pod didn't trigger scale-up (it wouldn't fit if a new node is added): 2 node(s) didn't match Pod's node affinity/selector

כדי לפתור את הבעיה, צריך לוודא שבקלאסטר Autopilot פועלת גרסת GKE‏ 1.24.1-gke.1400 ואילך, ושהאזורGoogle Cloud תומך בצמתי Arm.

חבילות (Pods) נתקעות במצב Pending

הכלל חל על: Autopilot

הבעיה הבאה מתרחשת כשמנסים לפרוס Autopilot Pods בארכיטקטורת Arm, אבל הפרויקט חורג מהמכסה. Google Cloud

כדי לזהות את הבעיה, צריך לקבל את יומן האירועים של האשכול:

kubectl get events -w

הפלט אמור להיראות כך:

29m         Warning   FailedScaleUp       pod/hello-app-7b86c88cb8-8vt2k   Node scale up in zones asia-southeast1-b associated with this pod failed: GCE quota exceeded. Pod is at risk of not being scheduled.

יכול להיות שהאירוע הזה לא יופיע ביומן מיד אחרי פריסת ה-Pods.

כדי לפתור את הבעיה, צריך לבקש שינוי במכסה.

המאמרים הבאים