תשתית אמינה היא דרישה קריטית לעומסי עבודה בענן. כ-Cloud Architect, כדי לתכנן תשתית אמינה לעומסי העבודה, אתם צריכים להבין היטב את יכולות האמינות של ספק שירותי הענן שבחרתם. במאמר הזה מתוארים אבני הבניין של האמינות ב-Google Cloud (אזורים, אזורים גיאוגרפיים ומשאבים בהיקף מיקום) ורמות הזמינות שהם מספקים. במסמך הזה מפורטות גם הנחיות להערכת דרישות האמינות של עומסי העבודה, ומוצגות המלצות לגבי ארכיטקטורה לבנייה ולניהול של תשתית אמינה ב- Google Cloud.
המסמך הזה מחולק לחלקים הבאים:
- סקירה כללית על מהימנות (החלק הזה)
- אבני הבניין של מהימנות ב- Google Cloud
- הערכת דרישות האמינות של עומסי העבודה בענן
- תכנון תשתית אמינה לעומסי העבודה ב- Google Cloud
- ניהול התנועה והעומס של עומסי העבודה ב- Google Cloud
- ניהול של Google Cloud התשתית ומעקב אחריה
אם קראתם את המדריך הזה בעבר ואתם רוצים לראות מה השתנה, תוכלו לעיין בהערות לגבי הגרסה.
סקירה כללית על אמינות
אפליקציה או עומס עבודה נחשבים לאמינים אם הם עומדים ביעדים הנוכחיים שלכם לגבי זמינות ועמידות בפני כשלים.
זמינות (או זמן פעולה) היא אחוז הזמן שבו אפשר להשתמש באפליקציה. לדוגמה, באפליקציה עם יעד זמינות של 99.99%, זמן ההשבתה הכולל לא יכול לעלות על 8.64 שניות במהלך תקופה של 24 שעות. לפעמים, הזמינות נמדדת כשיעור הבקשות שהאפליקציה מטפלת בהן בהצלחה במהלך תקופה מסוימת. לדוגמה, באפליקציה עם יעד זמינות של 99.99%, מתוך כל 100,000 בקשות שמתקבלות, יכולות להיכשל עד עשר בקשות. הזמינות מוצגת בדרך כלל כמספר התשיעיות באחוז. לדוגמה, זמינות של 99.99% נקראת '4 תשיעיות'.
בהתאם למטרה של האפליקציה, יכול להיות שיהיו לכם קבוצות שונות של אינדיקטורים שיצביעו על רמת המהימנות שלה. הנה כמה דוגמאות לאינדיקטורים כאלה:
- באפליקציות שמציגות תוכן, המדדים 'זמינות', 'חביון' ו'תפוקה' הם אינדיקטורים חשובים לאמינות. הם מציינים אם האפליקציה יכולה להגיב לבקשות, כמה זמן לוקח לאפליקציה להגיב לבקשות וכמה בקשות האפליקציה יכולה לעבד בהצלחה בפרק זמן נתון.
- במסדי נתונים ובמערכות אחסון, חביון, קצב העברת נתונים, זמינות ועמידות (עד כמה הנתונים מוגנים מפני אובדן או השחתה) הם אינדיקטורים של מהימנות. הם מציינים כמה זמן לוקח למערכת לקרוא או לכתוב נתונים, ואם אפשר לגשת לנתונים לפי דרישה.
- במקרים של עומסי עבודה של Big Data וניתוח נתונים, כמו צינורות עיבוד נתונים, ביצועים עקביים של צינור עיבוד הנתונים (תפוקה וחביון) הם חיוניים כדי להבטיח את עדכניותם של מוצרי הנתונים, והם מהווים אינדיקטור חשוב לאמינות. הם מציינים כמה נתונים אפשר לעבד, וכמה זמן לוקח לצינור עיבוד הנתונים להתקדם משלב קליטת הנתונים לשלב עיבוד הנתונים.
- ברוב האפליקציות, נכונות הנתונים היא אינדיקטור מהימנות חיוני.
הנחיות נוספות להגדרת יעדי המהימנות של האפליקציות זמינות במאמר הערכת דרישות המהימנות של עומסי העבודה בענן.
גורמים שמשפיעים על מהימנות האפליקציה
המהימנות של אפליקציה שנפרסה ב- Google Cloud תלויה בגורמים הבאים:
- העיצוב הפנימי של האפליקציה.
- האפליקציות או הרכיבים המשניים שהאפליקציה תלויה בהם.
- Google Cloud משאבי תשתית כמו מחשוב, רשת, אחסון, מסדי נתונים ואבטחה שהאפליקציה פועלת עליהם, ואיך האפליקציה משתמשת בתשתית.
- קיבולת התשתית שאתם מקצים, ואיך הקיבולת משתנה בהתאם לעומס.
- תהליכי ה-DevOps והכלים שבהם אתם משתמשים כדי ליצור, לפרוס ולתחזק את האפליקציה, את קשרי התלות שלה ואת התשתית. Google Cloud
הגורמים האלה מסוכמים בתרשים הבא:
כפי שמוצג בתרשים הקודם, המהימנות של אפליקציה שנפרסה ב- Google Cloud תלויה בכמה גורמים. המדריך הזה מתמקד באמינות של התשתית. Google Cloud
המאמרים הבאים
- אבני הבניין של מהימנות ב- Google Cloud
- הערכת דרישות האמינות של עומסי העבודה בענן
- תכנון תשתית אמינה לעומסי העבודה ב- Google Cloud
- ניהול התנועה והעומס של עומסי העבודה ב- Google Cloud
- ניהול של Google Cloud התשתית ומעקב אחריה
שותפים ביצירת התוכן
מחברים:
- Nir Tarcic | Cloud Lifecycle SRE UTL
- קומאר דהנגופאל | מפתח פתרונות חוצי-מוצרים
תורמי תוכן אחרים:
- Alok Kumar | Distinguished Engineer
- אנדרו פייקס | עמית בתחום ההנדסה, אמינות
- כריס הייזר | SRE TL
- David Ferguson | Director, Site Reliability Engineering
- Joe Tan | Senior Product Counsel
- Krzysztof Duleba | Principal Engineer
- נראיאן דסאי | מהנדס SRE ראשי
- Sailesh Krishnamurthy | VP, Engineering
- Steve McGhee | Reliability Advocate
- סודהנשו ג'אין | מנהל מוצר
- Yaniv Aknin | Software Engineer