在容量高峰事件發生前,請管理及最佳化調整 Google Cloud 工作負載使用的資源,包括根據實際用量和需求將資源調整為最適規模、使用自動調度資源功能動態分配資源,以及查看架構和安全性建議。Cloud Monitoring 和 Recommender (Active Assist) 都能協助您找出最佳化雲端資源的機會。使用這些工具,您可以在事件發生前深入瞭解資源用量,並做出明智決策。
查看 Google Cloud 最佳做法
只要遵循所用 Google Cloud 產品的建議最佳做法,就能避免許多容量高峰事件的問題。以下列舉幾項最佳做法指南:
| 一般 | |
| BigQuery | |
| Cloud Storage | |
| Compute Engine | |
| Dataflow | |
| Dataproc | |
| Google Kubernetes Engine |
檢查擴充性
自動調度資源可確保雲端應用程式擁有所需資源,既能處理不同工作負載,同時避免過度佈建和不必要的費用。 Google Cloud 提供多種產品專屬的自動調度資源選項,包括:
- Compute Engine 代管執行個體群組 (MIG) 是以單一實體形式管理及擴充的 VM 群組。使用 MIG 時,您可以定義自動調度資源政策,指定要在群組中維護的 VM 數量下限和上限,以及觸發自動調度資源的條件。
- Google Kubernetes Engine (GKE) 自動調度資源功能會動態調整叢集資源,以符合應用程式需求。除了提供工具來最佳化資源使用率,還能確保應用程式效能,同時簡化叢集管理作業。
- Cloud Run 提供內建的自動調度資源功能,可根據連入流量自動調整執行個體數量。
建議您在事件發生前手動擴大規模。雖然您可能已設定自動調度資源功能,但由於事件的流量速度過快,該功能可能無法滿足需求。因此請預先將以下資源暖機:
- 虛擬機器
- 快取 (如要預先載入的話)
- 無伺服器元件 (可防止冷啟動)
查看 Active Assist 建議
Active Assist 是指Google Cloud 用來生成建議和洞察資料的工具組合,有助於將 Google Cloud 專案調整至最佳狀態。詳情請參閱「什麼是 Active Assist」。
查看產品版本
請確保所有雲端產品和服務都已更新至最新穩定版。
查看快訊和資訊主頁
評估 Google Cloud Observability 工具和第三方解決方案提供的快訊和資訊主頁,主動找出及解決問題。
請查看 Google Cloud Observability 指標、記錄檔和追蹤記錄,深入瞭解資源使用情形、效能特徵和整體健康狀態。您可以監控與系統健康狀態指標一致的重要指標,例如 CPU 使用率、記憶體用量、網路流量、磁碟 I/O 和應用程式回應時間。您也應考慮使用特定業務指標。追蹤這些指標有助於找出潛在瓶頸、效能問題和資源限制。此外,您也可以設定快訊,主動通知相關團隊潛在問題或異常狀況。
如要採用快訊,請著重於重要指標、設定適當門檻,盡量避免快訊疲勞轟炸的情形,並確保及時回應重大問題。這種有目標的處理方式可讓您主動維護工作負載的可靠性。詳情請參閱「快訊總覽」。