בדף הזה מתואר מה קורה במהלך ניסוי עם סוג התקלה Fail Compute, ומה צריך לעשות אם בדיקה של הזרקת תקלות לא יכולה לעצור את הניסוי.
איך פועלת התקלה Fail Compute
התקלה Fail Compute משתמשת בתגי משאבים כדי לסמן מכונות וירטואליות, ובמדיניות חומת אש עם כללים שמכוונים לתגים האלה כדי לחסום את כל התנועה הנכנסת והיוצאת. ההגדרה הזו גורמת למשאבים הממוקדים להיראות כאילו הם מושבתים, תוך שמירה על כך שהם לא ייפגעו וניתן יהיה לשחזר אותם במהירות.
היעד של התקלה הזו יכול להיות אחד מהבאים:
- מכונות וירטואליות
- מכונות וירטואליות שמבוססות על תג משאב ספציפי
- מכונות וירטואליות בתוך קבוצה מנוהלת של מופעי מכונה (MIG) אזורית או אזורית
- מכונות וירטואליות שאינן חלק מ-MIG באזור ומכונות וירטואליות ב-MIG אזורי.
- מכונות וירטואליות שאינן חלק מקבוצת MIG באזור מסוים, ומכונות וירטואליות בכל קבוצות ה-MIG.
מה קורה במהלך הפעלת הניסוי
במהלך הניסוי, המשאבים שמשתתפים בו עוברים את השינויים הבאים בהתאם למצבים שלו.
משאב |
|
|
|
מכונות וירטואליות |
ללא |
קישור תג משאב |
ביטול הקישור של תג משאב |
MIGs / RMIGs |
ללא |
השבתה של תיקון אוטומטי ושינוי גודל אוטומטי (אם הם פעילים) |
שחזור ההגדרות של תיקון אוטומטי והתאמה אוטומטית לעומס |
תג |
יצירת משאב TagValue ייחודי לניסוי |
ללא |
מחיקת TagValue |
מדיניות חומת אש |
יצירת משאב FirewallPolicy ברמת SYSTEM |
מאכלסים את הכללים מסוג DENY ומקשרים את המדיניות לרשתות ה-VPC הרלוונטיות |
ביטול הקישור לרשתות VPC ומחיקת FirewallPolicy |
שחזור ידני במקרה חירום
במקרה של כשל קטסטרופלי בשרת העורפי שבו בדיקת הזרקת תקלות לא יכולה לעצור ניסוי באופן אוטומטי, אפשר לשחזר את הקישוריות למשאבי המכונה הווירטואלית באופן ידני על ידי הסרה ידנית של תגי המשאבים שקשורים למכונות הווירטואליות המושפעות. מדיניות חומת האש של המערכת, שמכוונת לתגים האלה, לא תחול יותר, ולמעשה המכונות הווירטואליות ינותקו מהתקלה בבידוד.
ההרשאות הנדרשות
אתם צריכים את הרשאות ה-IAM הבאות:
- ההרשאות שנדרשות כדי להציג מכונות וירטואליות:
compute.instances.getcompute.instances.list
- נדרשת הרשאה כדי לראות ולהסיר את הקישורים של התגים:
resourcemanager.tagValueBindings.listresourcemanager.tagValueBindings.delete
שחזור ידני באמצעות ממשק המשתמש של מסוף Google Cloud
כדי לבצע שחזור באמצעות מסוף Google Cloud :
- עוברים לדף VM instances במסוף Google Cloud .
- בוחרים את המכונות הווירטואליות הספציפיות שהושפעו מהכשל בבידוד.
- בדף הפרטים של המופע, עוברים לקטע שבו מנהלים את התגים.
- מזהים את הקישור של התג הספציפי לניסוי שמשויך לשגיאת החישוב של בדיקת הזרקת תקלות.
- הסרת קישור התגים מהמכונה הווירטואלית.
אחרי שמסירים את התג, מדיניות חומת האש המשויכת כבר לא תכוון למכונה הווירטואלית והקישוריות תשוחזר.
שחזור ידני באמצעות ה-CLI של gcloud
אפשר להסיר ידנית את הקישור של תג הניסוי ממכונה וירטואלית באמצעות Google Cloud CLI. בפקודות הבאות, מחליפים את TAG_VALUE_NAME,
PROJECT_NUMBER, ZONE ואת VM_NAME בערכים הספציפיים של הסביבה שלכם.
קודם כל, מאחזרים את שם הערך של התג הספציפי לניסוי על ידי הצגת רשימת קישורי התגים הנוכחיים של מכונת ה-VM:
gcloud resource-manager tag bindings list --resource=//compute.googleapis.com/projects/PROJECT_NUMBER/zones/ZONE/instances/VM_NAME
משתמשים בפלט של הפקודה הקודמת כדי לקבוע את TAG_VALUE_NAME שנדרש לשלב המחיקה:
gcloud resource-manager tag bindings delete --tag-value=TAG_VALUE_NAME --resource=//compute.googleapis.com/projects/PROJECT_NUMBER/zones/ZONE/instances/VM_NAME
אחרי שמסירים את התג, מדיניות חומת האש המשויכת כבר לא תכוון למכונה הווירטואלית והקישוריות תשוחזר.