הפניה לשגיאת Compute

בדף הזה מתואר מה קורה במהלך ניסוי עם סוג התקלה Fail Compute, ומה צריך לעשות אם בדיקה של הזרקת תקלות לא יכולה לעצור את הניסוי.

איך פועלת התקלה Fail Compute

התקלה Fail Compute משתמשת בתגי משאבים כדי לסמן מכונות וירטואליות, ובמדיניות חומת אש עם כללים שמכוונים לתגים האלה כדי לחסום את כל התנועה הנכנסת והיוצאת. ההגדרה הזו גורמת למשאבים הממוקדים להיראות כאילו הם מושבתים, תוך שמירה על כך שהם לא ייפגעו וניתן יהיה לשחזר אותם במהירות.

היעד של התקלה הזו יכול להיות אחד מהבאים:

  • מכונות וירטואליות
  • מכונות וירטואליות שמבוססות על תג משאב ספציפי
  • מכונות וירטואליות בתוך קבוצה מנוהלת של מופעי מכונה (MIG) אזורית או אזורית
  • מכונות וירטואליות שאינן חלק מ-MIG באזור ומכונות וירטואליות ב-MIG אזורי.
  • מכונות וירטואליות שאינן חלק מקבוצת MIG באזור מסוים, ומכונות וירטואליות בכל קבוצות ה-MIG.

מה קורה במהלך הפעלת הניסוי

במהלך הניסוי, המשאבים שמשתתפים בו עוברים את השינויים הבאים בהתאם למצבים שלו.

משאב

PREPARING

INJECTING

REVERTING

מכונות וירטואליות

ללא

קישור תג משאב

ביטול הקישור של תג משאב

MIGs / RMIGs

ללא

השבתה של תיקון אוטומטי ושינוי גודל אוטומטי (אם הם פעילים)

שחזור ההגדרות של תיקון אוטומטי והתאמה אוטומטית לעומס

תג

יצירת משאב TagValue ייחודי לניסוי

ללא

מחיקת TagValue

מדיניות חומת אש

יצירת משאב FirewallPolicy ברמת SYSTEM

מאכלסים את הכללים מסוג DENY ומקשרים את המדיניות לרשתות ה-VPC הרלוונטיות

ביטול הקישור לרשתות VPC ומחיקת FirewallPolicy

שחזור ידני במקרה חירום

במקרה של כשל קטסטרופלי בשרת העורפי שבו בדיקת הזרקת תקלות לא יכולה לעצור ניסוי באופן אוטומטי, אפשר לשחזר את הקישוריות למשאבי המכונה הווירטואלית באופן ידני על ידי הסרה ידנית של תגי המשאבים שקשורים למכונות הווירטואליות המושפעות. מדיניות חומת האש של המערכת, שמכוונת לתגים האלה, לא תחול יותר, ולמעשה המכונות הווירטואליות ינותקו מהתקלה בבידוד.

ההרשאות הנדרשות

אתם צריכים את הרשאות ה-IAM הבאות:

  • ההרשאות שנדרשות כדי להציג מכונות וירטואליות:
    • compute.instances.get
    • compute.instances.list
  • נדרשת הרשאה כדי לראות ולהסיר את הקישורים של התגים:
    • resourcemanager.tagValueBindings.list
    • resourcemanager.tagValueBindings.delete

שחזור ידני באמצעות ממשק המשתמש של מסוף Google Cloud

כדי לבצע שחזור באמצעות מסוף Google Cloud :

  1. עוברים לדף VM instances במסוף Google Cloud .
  2. בוחרים את המכונות הווירטואליות הספציפיות שהושפעו מהכשל בבידוד.
  3. בדף הפרטים של המופע, עוברים לקטע שבו מנהלים את התגים.
  4. מזהים את הקישור של התג הספציפי לניסוי שמשויך לשגיאת החישוב של בדיקת הזרקת תקלות.
  5. הסרת קישור התגים מהמכונה הווירטואלית.

אחרי שמסירים את התג, מדיניות חומת האש המשויכת כבר לא תכוון למכונה הווירטואלית והקישוריות תשוחזר.

שחזור ידני באמצעות ה-CLI של gcloud

אפשר להסיר ידנית את הקישור של תג הניסוי ממכונה וירטואלית באמצעות Google Cloud CLI. בפקודות הבאות, מחליפים את TAG_VALUE_NAME, PROJECT_NUMBER, ZONE ואת VM_NAME בערכים הספציפיים של הסביבה שלכם.

קודם כל, מאחזרים את שם הערך של התג הספציפי לניסוי על ידי הצגת רשימת קישורי התגים הנוכחיים של מכונת ה-VM:

gcloud resource-manager tag bindings list --resource=//compute.googleapis.com/projects/PROJECT_NUMBER/zones/ZONE/instances/VM_NAME

משתמשים בפלט של הפקודה הקודמת כדי לקבוע את TAG_VALUE_NAME שנדרש לשלב המחיקה:

gcloud resource-manager tag bindings delete --tag-value=TAG_VALUE_NAME --resource=//compute.googleapis.com/projects/PROJECT_NUMBER/zones/ZONE/instances/VM_NAME

אחרי שמסירים את התג, מדיניות חומת האש המשויכת כבר לא תכוון למכונה הווירטואלית והקישוריות תשוחזר.