בדיקת מופע ראשי לזמינות גבוהה

‫AlloyDB ל-PostgreSQL מציע סוגים של מכונות אזוריות ואזורי זמינות. כדי להבטיח זמינות גבוהה (HA), לכל מכונה מרכזית אזורית של AlloyDB יש גם צומת פעיל וגם צומת בהמתנה, שממוקמים בשני אזורי זמינות שונים. אם הצומת הפעיל לא זמין מסיבה כלשהי, מערכת AlloyDB מקדמת אוטומטית את הצומת בהמתנה והופכת אותו לצומת הפעיל החדש.

כדי לבדוק את התכונה האוטומטית הזו של זמינות גבוהה, אפשר להשתמש בהחדרת תקלות כדי להוציא את הצומת הפעיל של המופע הראשי ממצב אונליין באופן פתאומי. ‫AlloyDB מפעיל את הליך ה-HA לשעת חירום, שבודק את תקינות המכונה הראשית ואז מקצה מחדש את צומת הגיבוי לתפקיד של צומת פעיל.

הזרקת תקלות גם מפעילה פעולה ארוכת טווח שמחזירה את הצומת הפעיל הקודם למצב אונליין אחרי פרק זמן קצר. הצומת הזה הופך לצומת ההמתנה החדש של המופע הראשי.

כדי להחליף בין התפקידים הפעיל וההמתנה של הצמתים של המופע הראשי בשיטה מהירה יותר, אפשר לעיין במאמר בנושא מעבר לגיבוי בעת כשל של מופע ראשי באופן ידני.

לפני שמתחילים

  • בפרויקט שבו אתם משתמשים צריך להפעיל גישה ל-AlloyDB. Google Cloud
  • צריך להיות לכם אחד מתפקידי ה-IAM האלה בפרויקט Google Cloud שבו אתם משתמשים:
    • roles/alloydb.admin (תפקיד IAM מוגדר מראש של אדמין AlloyDB)
    • roles/owner (תפקיד בסיסי ב-IAM: בעלים)
    • roles/editor (תפקיד בסיסי ב-IAM עם הרשאת עריכה)

    אם לא הוקצו לכם התפקידים האלה, פנו לאדמין הארגוני כדי לבקש גישה.

סימולציה של הפסקת שירות באמצעות החדרת תקלות

כדי לבדוק את עמידות ה-HA של המכונה הראשית על ידי כיבוי פתאומי של הצומת הפעיל שלה, משתמשים בפקודה gcloud alloydb instances inject-fault. אחרי שהפעולה הממושכת מסתיימת, AlloyDB מחזיר את הצומת למצב פעיל.

gcloud alloydb instances inject-fault INSTANCE_ID \
    --fault-type=stop-vm \
    --region=REGION_ID \
    --cluster=CLUSTER_ID \
    --project=PROJECT_ID
  • INSTANCE_ID: המזהה של המכונה.
  • REGION_ID: האזור שבו המכונה ממוקמת.
  • CLUSTER_ID: המזהה של האשכול שבו המכונה ממוקמת.
  • PROJECT_ID: מזהה הפרויקט שבו נמצא האשכול.