Google Cloud Well-Architected Framework 费用优化核心中的这一原则提供了相关建议,可帮助您根据组织的业务目标调整 Google Cloud 资源的使用方式。
原则概览
为了有效管理云费用,您需要最大限度地提高云资源提供的业务价值,并最大限度地降低总拥有成本 (TCO)。在评估云工作负载的资源选项时,不仅要考虑资源预配和使用成本,还要考虑资源管理成本。例如,Compute Engine 上的虚拟机 (VM) 可能是托管应用的经济实惠之选。不过,考虑到维护、修补和扩缩虚拟机的开销,总拥有成本可能会增加。另一方面,Cloud Run 等无服务器服务可以提供更高的商业价值。较低的运营开销可让您的团队专注于核心活动,并有助于提高敏捷性。
为确保云资源发挥最佳价值,请评估以下因素:
- 预配和使用费用:购买、预配或使用资源时产生的费用。
- 管理费用:运营和维护资源的经常性支出,包括修补、监控和伸缩等任务。
- 间接费用:您可能需要支付的用于管理停机、数据丢失或安全违规等问题的费用。
- 业务影响:资源带来的潜在益处,例如收入增加、客户满意度提高和上市期缩短。
通过让云支出与业务价值相匹配,您可以获得以下好处:
- 以价值为导向的决策:鼓励团队优先考虑可带来最大业务价值的解决方案,并同时考虑短期和长期成本影响。
- 明智的资源选择:您的团队拥有评估各种部署方案的业务价值和总拥有成本所需的信息和知识,因此他们可以选择经济实惠的资源。
- 跨团队协调一致:业务、财务和技术团队之间的跨职能协作可确保云决策与组织的总体目标保持一致。
建议
为了让云支出与业务目标保持一致,请考虑以下建议。
优先考虑托管式服务和无服务器产品
尽可能选择托管式服务和无服务器产品,以减少运营开销和维护费用。这样,您的团队就可以专注于核心业务活动。它们可以加快新功能和新功能的交付速度,并有助于推动创新和价值创造。
以下示例说明了如何实现此建议:
- 如需运行 PostgreSQL、MySQL 或 Microsoft SQL Server 服务器数据库,请使用 Cloud SQL,而不是在虚拟机上部署这些数据库。
- 如需运行和管理 Kubernetes 集群,请使用 Google Kubernetes Engine (GKE) Autopilot,而不是在虚拟机上部署容器。
- 如需满足 Apache Hadoop 或 Apache Spark 处理需求,请使用 Managed Service for Apache Spark 和 Managed Service for Apache Spark Serverless。 与本地数据湖相比,按秒计费有助于大幅降低总拥有成本。
在成本效益与业务敏捷性之间取得平衡
控制成本和优化资源利用率是非常重要的目标。不过,您必须在实现这些目标的同时,兼顾对灵活基础设施的需求,以便快速创新、快速应对变化并更快地交付价值。以下示例说明了如何实现这种平衡:
- 采用 DORA 指标来衡量软件交付绩效。更改失败率 (CFR)、检测时间 (TTD) 和恢复时间 (TTR) 等指标有助于识别和修复开发和部署流程中的瓶颈。通过减少停机时间和加快交付速度,您可以同时实现运营效率和业务敏捷性。
- 遵循站点可靠性工程 (SRE) 实践,以提高运营可靠性。SRE 专注于自动化、可观测性和突发事件响应,有助于减少停机时间、缩短恢复时间并提高客户满意度。通过最大限度地缩短停机时间并提高运营可靠性,您可以避免收入损失,并避免因需要过度配置资源来应对中断而造成的浪费。
启用自助优化
为团队提供自助式费用优化工具、可观测性工具和资源管理平台,鼓励他们进行实验和探索。使他们能够自主预配、管理和优化云资源。这种方法有助于培养责任感、加快创新速度,并确保团队能够快速响应不断变化的需求,同时注意成本效益。
采用和实现 FinOps
采用 FinOps 来建立协作环境,让每个人都能做出明智的决策,在成本和价值之间取得平衡。FinOps 可培养财务责任感,并促进云端有效的费用优化。
树立以价值为导向且注重总拥有成本的思维方式
鼓励团队成员以整体视角看待云支出,重点关注总拥有成本,而不仅仅是前期成本。使用价值流映射等技术,直观呈现并分析软件交付流程中的价值流,找出需要改进的方面。为应用和服务实施单位成本核算,以便精细了解成本驱动因素,并发现成本优化机会。如需了解详情,请参阅借助 Cloud FinOps 最大限度地提高业务价值。