שילוב עם המרכז האישי ב-Service Health

שיבושים בשירות הם בלתי נמנעים, אבל תקשורת שקופה ומוקדמת חיונית כדי להעריך מה קורה, לעדכן את בעלי העניין ולבצע פעולות שיצמצמו את ההשפעה על העסק.

הפעלת אפליקציה אמינה בענן היא אחריות משותפת שלGoogle Cloud ומפתחי האפליקציה. במקרה של שיבוש בשירות,Google Cloud שואפת לדווח על האירוע במהירות ולספק הערכת השפעה. צריך להעריך איך לקבל התראות, איך לפעול במקרה של אירועים מתפתחים ואיך לנהל את ההשפעה על האפליקציה.

המרכז האישי ב-Service Health יכול לעזור בתהליך הזה. אפשר לשלב אותו בדרכים שונות כדי לקבל מידע על אירועים מתפתחים, להעריך את ההשפעה על האפליקציות ולקבל עדכונים מ- Google Cloud. במסמך הזה מוסבר איך לקבל אותות על שיבושים בשירות מ-Google Cloud, כולל המלצות לשילוב עם האותות האלה.

החלטה על מיקום השילוב

במרכז האישי שלכם ב-Service Health אתם יכולים לראות את המוצרים של Google Cloud שבהם אתם משתמשים בפרויקטים או בארגון שלכם. מומלץ לבצע שילוב עם Personalized Service Health כדי לקבל את הכיסוי הרחב ביותר ואת מגוון האפשרויות הגדול ביותר לשילוב.

נקודת שילוב תרחיש לדוגמה יתרונות תלות
לוח הבקרה של הקונסולה (Service Health בהתאמה אישית) צפייה בשיבושים פעילים בהתאמה אישית לפרויקטים שלכם, זמין כברירת מחדל ניהול זהויות והרשאות גישה (IAM)
Google Cloud מסוף
התראות (המרכז האישי ב-Service Health) התראות יזומות מותאם אישית לפרויקטים שלכם, נוח ופרואקטיבי ‫IAM
Cloud Logging
Cloud Monitoring
API (Personalized Service Health) שילוב עם מערכת או כלי אחרים מותאם אישית לפרויקטים או לארגון IAM

בחירת שיטת האינטראקציה עם המרכז האישי ב-Service Health

חשוב להשתמש במרכז האישי ב-Service Health בהקשר של הפעולות המתוכננות, המעקב ומודל התגובה לאירועים. אפשר להעריך איך הצוותים שלכם משתמשים באותות במהלך אירועים ולפני שהם מתרחשים, וכך להחליט איך אתם רוצים להשתמש ב-Service Health בהתאמה אישית.

בטבלה הבאה אפשר לראות דוגמאות לאינטראקציות עם Service Health בהתאמה אישית, בהתאם לאופן ההגדרה שלו.

תרחיש לדוגמה בארגון שילוב עם המרכז האישי ב-Service Health דוגמאות לכלים שאפשר לשלב עם Google Ads
מפתחים שזמינים לתמיכה בכמה אפליקציות התראות על פרויקטים ספציפיים

לוח הבקרה של המסוף

Google Cloud Observability, ‏ PagerDuty
תגובה מרכזית לאירועים בארגון שילוב של API עם מערכת קיימת באמצעות OrganizationEvents API‏ (v1, ‏ v1beta) PagerDuty, מרכזי בקרה מותאמים אישית
פלטפורמה פנימית לניהול משאבים ופעולות בענן ‫Service Health API
התראות לגבי פרויקט ספציפי
שילוב של Service Health API עם פלטפורמת פיתוח פנימית
מאחורי הקלעים, Terraform
פרויקטים רבים שמוגדרים ומנוהלים באופן פרוגרמטי (לדוגמה: 1,000+) ‫Service Health API
התראות אוטומטיות מבוססות API
Backstage, ‏ Terraform, ‏ PagerDuty

שימוש במרכז האישי ב-Service Health במהלך אירוע

אחרי שתבצעו שילוב עם המרכז האישי ב-Service Health ותתחילו לקבל התראות, תוכלו למצוא במרכז האישי מידע על שיבושים שיעזור לכם לנהל את ההשפעה שלהם. Google Cloud

זיהוי האירוע והגדרת ההיקף שלו

דוגמאות לשאלות שאפשר לשאול בשלב הזה:

  • האם זו בעיה אמיתית?
  • האם תוכל לאמת את ההשפעה?
  • מהם התסמינים?
  • אילו משתמשים, מוצרים או חלקים בעסק מושפעים? באילו מיקומים גיאוגרפיים?

המרכז האישי ב-Service Health עוזר לכם להבין אם הבעיה נובעת מהפרויקט שלכם או מ-Google, כדי שתוכלו ליישם את התגובה המתאימה לאירוע. הוא מאפשר לכם למצוא ולראות מידע על אירועים, כדי שתוכלו לעקוב אחרי האירוע, המוצרים המושפעים והמיקומים שמשפיעים על הפרויקט.

אפשר לנסות את הפתרונות הבאים:

  1. בודקים את ההתראה, אם הגדרתם אותה.
    • מה גרם להפעלת ההתראה הזו?
    • איך ההתראות האלה משתלבות עם כל ההתראות האחרות שקשורות למוצרים?
  2. נכנסים ללוח הבקרה של Service Health עבור הפרויקט או הארגון. תוכלו לראות את האירועים, המוצרים המושפעים והמיקומים במבט חטוף, ולענות על השאלות הבאות:
    • אילו פרויקטים מושפעים מהשינוי?
    • אילו מוצרים שהפרויקט שלכם תלוי בהם יושפעו מהשינוי?
    • האם האירוע משפיע על משאבים ספציפיים במיקומים האלה?
  3. בודקים את האירועים ומבינים את ההיקף, ההשפעה והרלוונטיות שלהם לפרויקט.
  4. מזהים אירוע שנראה שקשור לבעיה שאתם רואים.
  5. תוכלו למצוא את שלבי האימות, את הפתרונות האפשריים (אם יש) ואת הזמן הצפוי לפתרון הבעיה באירוע.

המרכז האישי ב-Service Health מאפשר לכם לבדוק את המצב הנוכחי של אירועים שמשפיעים על הפרויקט או על הארגון שלכם, ואת ההשפעה שלהם, כדי שתוכלו לנהל אותם ולטפל בהם ביעילות. לדוגמה, כדי לתת עדיפות בצורה יעילה, צריך לזהות במדויק את האירוע בעדיפות הגבוהה ביותר.

צמצום ההשפעה של האירוע, פתרון הבעיה או העברת הטיפול לרמה גבוהה יותר

דוגמאות לשאלות שאפשר לשאול בשלב הזה:

  • איך אפשר לעקוף את הבעיה?
  • האם אפשר לתקן את הבעיה ישירות?
  • האם כדאי להתחיל בהעברה או להמתין עוד?
  • למי צריך לפנות כדי לתקן את הבעיה?

במרכז האישי ב-Service Health אתם יכולים להבין את ההשפעה של אירוע על הפרויקטים והמשאבים שלכם, לקבל מידע על פתרונות עקיפים שזמינים ולקבל עדכונים על הזמן המשוער לפתרון הבעיה.

מעקב אחר ההתקדמות לקראת פתרון האירוע

בסקירה הכללית של האירוע בלוח הבקרה Service Health מופיע מידע חשוב כמו תסמינים ופתרונות עקיפים, שנדרשים לצורך צמצום ההשפעה של האירוע. בנוסף, מוצג מתי חל שינוי במצב. הפרטים האלה מאפשרים לכם:

  • עוקבים אחרי סיכום שוטף של ההשפעה הפוטנציאלית ככל שהמצב מתפתח.
  • כדאי להתעדכן לגבי פיתוחים חדשים והמועד הצפוי לעדכון או ליצירת קשר הבאים.
  • לראות מתי תסמין מתפרסם.
  • לראות מתי מזוהה פתרון עקיף.
  • כשהסטטוס משתנה לנפתר.

במהלך המעקב אחרי ההתקדמות, אפשר לבצע את הפעולות הבאות:

  • בודקים אם יש פתרונות עקיפים.
  • מטמיעים את התגובה לתקרית שמתאימה לפרויקט או לארגון.
  • ממשיכים לעקוב אחרי האירוע עד שהוא נפתר או עד שההשפעה שלו מצטמצמת.

מתי צריך לפנות לתמיכה

‫Google מודעת לאירועים שמופיעים בלוח הבקרה של Service Health. כדי לדעת מה Google עושה לגבי אירוע, בוחרים אותו כדי לראות את הפרטים.

אם נראה שבעיה מסוימת לא מיוצגת באף אחד מהאירועים בלוח הבקרה, צריך לפנות לתמיכה.

שימוש ב-Service Health בהתאמה אישית עם מקורות אחרים של מידע על אירועים

לא משנה איך החברה שלכם מוגדרת, כדאי להשתמש ב-Service Health בהתאמה אישית כאות נוסף כשמעריכים את ההשפעה של אירועים. חשוב לבדוק כמה מקורות מידע על האירוע כדי להחליט על השלבים הבאים על סמך נתונים וראיות.

הסיבות לשימוש בכמה מקורות מידע על אירועים כוללות:

  • יכול להיות שמתרחש אירוע שמשפיע על מוצר מסוים במיקום מסוים, אבל הפרויקטים שלכם לא מושפעים כי הם נמצאים במיקום אחר. Google Cloud
  • אם במערכת להצגת מודעות יש שני עותקים מלאים באזורים נפרדים, ומוצר קריטי Google Cloud באחד האזורים נכשל, המרכז האישי שלכם ב-Service Health יודיע לכם על הכשל הזה. עם זאת, יכול להיות שהמשתמשים שלכם לא יושפעו בפועל ולא תצטרכו לבצע פעולה מיידית.
  • אם הפרויקט שלכם תלוי בהרבה Google Cloud מוצרים במיקום מסוים, המערכת של Service Health בהתאמה אישית לא תדע:
    • אם הפרויקט שלכם דורש שכל המוצרים יהיו תקינים.
    • אם הפרויקט ימשיך לפעול במקרה של כשל במוצר אחד.
    • אם אחד או יותר מהמוצרים נכשלים, כל הבקשה מושפעת.
  • יכול להיות שגם המרכז האישי ב-Service Health יפעל בצורה מוגבלת או ייכשל. כדי לאמת את העסק, אפשר לבדוק את הסטטוס שלו.

תצטרכו לפרש את האותות מהמרכז האישי ב-Service Health בהתאם להגדרות שלכם.