ניהול אירועים של שגיאות בשירות

הכלי Error Reporting מאפשר לכם לזהות, להבין ולנהל כשלים באפליקציות. הכלי מתעד באופן אוטומטי קריסות של אפליקציות ומקבץ את עקבות המחסנית מהקריסות האלה לקבוצות שגיאות. שגיאות בשירות דיווח השגיאות מתעדות באופן אוטומטי מידע על כשלים בשירותים של Google Cloud כשהם כותבים רשומות ביומן שכוללות מידע על כשלים כהודעות שגיאה, במקום כמעקב אחר מחסנית.

לדוגמה, נניח שאתם משתמשים ב-Cloud Run ומגיעים למגבלה המקסימלית של מופעי קונטיינרים כשאתם שולחים בקשה. הכשל של הבקשה נרשם ברשומה ביומן, ו-Error Reporting מתעד באופן אוטומטי את אירוע השגיאה הזה, מקבץ אותו עם אירועי שגיאה דומים ושולח לכם התראה. כדי לפתור אירועי שגיאה שקשורים לשירות, אפשר להיעזר במסמכי פתרון הבעיות הספציפיים לשירות שאפשר לגשת אליהם מדף Error Reporting.

צפייה בקבוצות של שגיאות בשירות

נכנסים לדף Error Reporting במסוף Google Cloud :

עבור אל Error Reporting

אפשר גם להשתמש בסרגל החיפוש כדי למצוא את הדף הזה.

כש-Error Reporting קובע שיש כשל בשירות, הוא מקבץ את אירועי השגיאה האלה ומגדיר את סוג השגיאה כ-Service error. בדף הסקירה הכללית של Error Reporting מוצג סוג השגיאה, וגם מידע נוסף על קבוצת השגיאות:

דף סקירה כללית של Error Reporting

לגבי אירועי שגיאות בשירות עם פתרונות מתועדים, Error Reporting מספק קישור למדריך לפתרון בעיות שסופק על ידיGoogle Cloud השירות.

אירועי שגיאה בשירות לדוגמה

בטבלה הבאה מפורטים חלק מאירועי השגיאה שמתועדים ב'שגיאות שירות' ב-Error Reporting.

Google Cloud שם השירות סוג השגיאה
Dataflow הגבלת קצב העברת נתונים ביומני עובדים
אין מספיק זיכרון (מערכת)
חסרה רשת משנה בהתאמה אישית
פעולה ארוכה בשלב
קריסת JRE
קובץ JAR של עובד לא מוגדר
Cloud Run חריגה ממגבלת הזיכרון
אין מופעים זמינים
Google Kubernetes Engine ‫Pod לא תקין, בקשה לבדיקת תקינות (probe) נכשלה
Pods נכשלו בהקצאה
מפעיל מחדש קונטיינר שנכשל עם השהיה לפני ניסיון חוזר (backoff)
Volume מנותק
שליפת קובץ אימג' של קונטיינר נכשלה
עדכון נקודת קצה נכשל
Secrets/configmaps לא נמצאו