Well-Architected 프레임워크의 비용 최적화 요소 원칙은 리소스 사용을 조직의 비즈니스 목표에 맞게 조정하기 위한 권장사항을 제공합니다.Google Cloud Google Cloud
원칙 개요
클라우드 비용을 효과적으로 관리하려면 클라우드 리소스가 제공하는 비즈니스 가치를 극대화하고 총 소유 비용 (TCO)을 최소화해야 합니다. 클라우드 워크로드의 리소스 옵션을 평가할 때는 리소스 프로비저닝 및 사용 비용뿐만 아니라 리소스 관리 비용도 고려하세요. 예를 들어 Compute Engine의 가상 머신 (VM)은 애플리케이션 호스팅을 위한 비용 효율적인 옵션일 수 있습니다. 하지만 VM을 유지보수, 패치, 확장하는 오버헤드를 고려하면 TCO가 증가할 수 있습니다. 반면에 Cloud Run과 같은 서버리스 서비스는 더 큰 비즈니스 가치를 제공할 수 있습니다. 운영 오버헤드가 낮으면 팀이 핵심 활동에 집중하고 민첩성을 높일 수 있습니다.
클라우드 리소스가 최적의 가치를 제공하도록 하려면 다음 요소를 평가하세요.
- 프로비저닝 및 사용 비용: 리소스를 구매, 프로비저닝 또는 소비할 때 발생하는 비용입니다.
- 관리 비용: 패치, 모니터링, 확장과 같은 작업을 포함하여 리소스를 운영하고 유지보수하는 데 드는 반복적인 비용입니다.
- 간접 비용: 다운타임, 데이터 손실, 보안 침해와 같은 문제를 관리하는 데 발생할 수 있는 비용입니다.
- 비즈니스 영향: 수익 증대, 고객 만족도 향상, 출시 기간 단축과 같은 리소스의 잠재적 이점입니다.
클라우드 지출을 비즈니스 가치에 맞게 조정하면 다음과 같은 이점이 있습니다.
- 가치 기반 의사결정: 팀은 가장 큰 비즈니스 가치를 제공하는 솔루션에 우선순위를 부여하고 단기 및 장기 비용 영향을 모두 고려하도록 권장됩니다.
- 정보에 입각한 리소스 선택: 팀은 다양한 배포 옵션의 비즈니스 가치와 TCO를 평가하는 데 필요한 정보와 지식을 보유하므로 비용 효율적인 리소스를 선택합니다.
- 팀 간 조정: 비즈니스팀, 재무팀, 기술팀 간의 교차 기능 협업을 통해 클라우드 의사결정이 조직의 전반적인 목표와 일치하도록 합니다.
권장사항
클라우드 지출을 비즈니스 목표에 맞게 조정하려면 다음 권장사항을 고려하세요.
관리형 서비스 및 서버리스 제품에 우선순위 지정
가능하면 관리형 서비스와 서버리스 제품 을 선택하여 운영 오버헤드와 유지보수 비용을 줄이세요. 이 선택을 통해 팀은 핵심 비즈니스 활동에 집중할 수 있습니다. 새로운 기능과 기능의 제공을 가속화하고 혁신과 가치를 창출하는 데 도움이 될 수 있습니다.
다음은 이 권장사항을 구현하는 방법의 예입니다.
- PostgreSQL, MySQL 또는 Microsoft SQL Server 서버 데이터베이스를 실행하려면 VM에 이러한 데이터베이스를 배포하는 대신 Cloud SQL 을(를) 사용하세요.
- Kubernetes 클러스터를 실행하고 관리하려면 Google Kubernetes Engine (GKE) Autopilot VM에 컨테이너를 배포하는 대신 사용하세요.
- Apache Hadoop 또는 Apache Spark 처리 요구사항의 경우 Apache Spark용 관리형 서비스 및 Apache Spark용 관리형 서비스 서버리스를 사용하세요. 초당 결제를 사용하면 온프레미스 데이터 레이크에 비해 TCO를 크게 낮출 수 있습니다.
비용 효율성과 비즈니스 민첩성의 균형 유지
비용 관리 및 리소스 사용률 최적화는 중요한 목표입니다. 하지만 이러한 목표와 혁신을 빠르게 수행하고, 변경사항에 신속하게 대응하고, 가치를 더 빠르게 제공할 수 있는 유연한 인프라의 요구사항 간에 균형을 유지해야 합니다. 다음은 이러한 균형을 달성하는 방법의 예입니다.
- 소프트웨어 배포 성능에 DORA 측정항목 을 채택합니다. 변경 실패율 (CFR), 감지 시간 (TTD), 복원 시간 (TTR)과 같은 측정항목은 개발 및 배포 프로세스의 병목 현상을 식별하고 해결하는 데 도움이 될 수 있습니다. 다운타임을 줄이고 제공을 가속화하면 운영 효율성과 비즈니스 민첩성을 모두 달성할 수 있습니다.
- 사이트 안정성 엔지니어링 (SRE) 관행을 따라 운영 안정성을 개선합니다. 자동화, 관측 가능성, 사고 대응에 중점을 두는 SRE는 다운타임 감소, 복구 시간 단축, 고객 만족도 향상으로 이어질 수 있습니다. 다운타임을 최소화하고 운영 안정성을 개선하면 수익 손실을 방지하고 중단을 처리하기 위한 안전망으로 리소스를 과도하게 프로비저닝할 필요가 없습니다.
셀프서비스 최적화 지원
팀에 셀프서비스 비용 최적화 도구, 관측 가능성 도구, 리소스 관리 플랫폼을 제공하여 실험 및 탐색 문화를 장려합니다. 팀이 클라우드 리소스를 자율적으로 프로비저닝, 관리, 최적화할 수 있도록 지원합니다. 이 접근 방식은 주인의식을 함양하고 혁신을 가속화하며 팀이 변화하는 요구사항에 신속하게 대응할 수 있도록 비용 효율성을 염두에 둡니다.
FinOps 채택 및 구현
FinOps를 채택하여 모든 사용자가 비용과 가치의 균형을 맞추는 정보에 입각한 의사결정을 내릴 수 있는 협업 환경을 구축합니다. FinOps는 재정적 책임을 장려하고 클라우드에서 효과적인 비용 최적화를 촉진합니다.
가치 기반 및 TCO 인식 사고방식 장려
팀원들이 초기 비용뿐만 아니라 TCO에 중점을 두고 클라우드 지출에 대한 전체적인 태도를 채택하도록 장려합니다. 가치 흐름 매핑과 같은 기법을 사용하여 소프트웨어 배포 프로세스를 통한 가치 흐름을 시각화하고 분석하며 개선할 영역을 식별합니다. 애플리케이션 및 서비스에 단위 비용 책정을 구현하여 비용 동인을 세부적으로 파악하고 비용 최적화 기회를 발견합니다. 자세한 내용은 Cloud FinOps로 비즈니스 가치 극대화를 참조하세요.