Google Cloud Well-Architected Framework 的卓越營運支柱提供相關建議,協助您在 Google Cloud上有效率地執行工作負載。雲端卓越作業成效包括設計、導入及管理雲端解決方案,以提供價值、效能、安全性和可靠性。這個支柱中的建議可協助您持續改善及調整工作負載,以因應雲端中不斷變化的需求。
營運卓越支柱適用於下列目標對象:
- 經理和領導者:建立及維持雲端卓越營運的架構,確保雲端投資能帶來價值並支援業務目標。
- 雲端作業團隊:提供指引,協助管理事件和問題、規劃容量、提升效能及管理變更。
- 網站可靠性工程師 (SRE):協助您達到高服務可靠性的最佳做法,包括監控、事件應變和自動化。
- 雲端架構師和工程師:設計和導入階段的作業需求和最佳做法,確保解決方案的設計能兼顧作業效率和擴充性。
- DevOps 團隊:提供自動化、CI/CD 管道和變更管理方面的指引,協助您更快且更可靠地交付軟體。
如要實現卓越營運,您應採用自動化、自動化調度管理和資料驅動的深入分析。自動化有助於減少手動作業。此外,這項工具還能簡化重複性工作,並建立相關防護措施。自動調度管理機制可協助協調複雜的程序。資料導向洞察可協助您根據證據做出決策。採用這些做法可最佳化雲端作業、降低成本、提升服務可用性,以及加強安全性。
雲端作業卓越營運的意義,不只是精通雲端作業技術,包括鼓勵持續學習和實驗的文化轉變。團隊必須有權創新、反覆運算,並培養成長型思維。卓越營運文化可促進協作環境,鼓勵個人分享想法、挑戰假設,並推動改善。
如要瞭解 AI 和機器學習工作負載的卓越營運原則和建議,請參閱 Well-Architected Framework 中的「AI and ML perspective: Operational excellence」。
核心原則
Well-Architected Framework 的卓越營運支柱建議,對應至下列核心原則:
- 使用 CloudOps 確認作業準備度與成效: 定義服務等級目標 (SLO),並執行全面監控、效能測試和容量規劃,確保雲端解決方案符合作業和效能需求。
- 管理事件和問題: 透過全面觀測能力、明確的事件應變程序、詳盡的回顧和預防措施,盡量減少雲端事件的影響,並防止再次發生。
- 管理及最佳化雲端資源: 透過適當調整大小、自動調度資源等策略,以及使用有效的成本監控工具,最佳化及管理雲端資源。
- 自動執行及管理變更: 自動執行程序、簡化變更管理,並減輕手動作業的負擔。
- 持續改良和創新: 專注於持續改善現有功能及推出新解決方案,以維持競爭力。
貢獻者
作者:
- Ryan Cox | 首席架構師
- Hadrian Knotz | 企業架構師
其他貢獻者:
- Daniel Lees | 雲端安全架構師
- Filipe Gracio 博士 | 客戶工程師、AI/機器學習專家
- Gary Harmson | 首席架構師
- Jose Andrade | 客戶工程師、SRE 專家
- Kumar Dhanagopal | 跨產品解決方案開發人員
- Nicolas Pintaux | 客戶工程師、應用程式現代化專家
- Radhika Kanakam | Google Cloud Well-Architected Framework 計畫主管
- Samantha He | 技術文件撰稿者
- Zach Seils | 網路專員
- Wade Holmes | 全球解決方案總監