Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
設定合理的可靠性目標
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
Last reviewed 2024-12-30 UTC
Google Cloud Well-Architected Framework 的可靠性支柱中,這項原則可協助您為 Google Cloud中的工作負載定義技術上可行的可靠性目標。
這項原則與可靠性的範圍
重點領域相關。
原則總覽
設計系統時,只要確保可靠性足以讓使用者感到滿意即可。這或許有違直覺,但以 100% 可靠性為目標,往往不是最有效的策略。提高可靠性可能會導致成本大幅增加,包括財務投資和創新潛力的限制。如果使用者對目前的服務水準感到滿意,那麼進一步提升滿意度的努力可能無法帶來高投資報酬率。您可以將資源用在其他地方。
您需要判斷使用者滿意的可靠性程度,並找出增量改善的成本開始超過效益的點。當您判斷達到足夠的可靠性層級時,就能策略性地分配資源,並專注於為使用者提供更高價值的改善和功能。
建議
如要設定合理的可靠性目標,請參考下列小節的建議。
接受部分失敗並優先處理元件
目標是達到高可用性 (例如 99.99% 的運作時間),但請勿將運作時間設為 100%。瞭解某些失敗是無可避免的。
100% 正常運作時間與 99.99% 目標之間的差距,就是容許的故障時間。這個差距通常稱為「錯誤預算」。錯誤預算可協助您冒險創新,這對任何企業維持競爭力都至關重要。
優先確保系統中最重要元件的可靠性。
接受容錯程度較高的非重要元件。
兼顧可靠性和成本
如要判斷系統的最佳可靠性等級,請進行詳盡的成本效益分析。
請考量系統需求、失敗的後果,以及貴機構對特定應用程式的風險容許度。請記得考量災難復原指標,例如復原時間目標 (RTO) 和復原點目標 (RPO)。根據預算和其他限制,決定可接受的可靠性等級。
尋找提高效率和降低成本的方法,同時確保基本可靠性功能不受影響。
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2024-12-30 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2024-12-30 (世界標準時間)。"],[],[]]