Definir metas realistas de confiabilidade

Last reviewed 2024-12-30 UTC

Esse princípio no pilar de confiabilidade do Google Cloud Well-Architected Framework ajuda a definir metas de confiabilidade tecnicamente viáveis para suas cargas de trabalho em Google Cloud.

Esse princípio é relevante para a área de foco de escopo da confiabilidade.

Visão geral do princípio

Projete seus sistemas para serem confiáveis o suficiente para a satisfação do usuário. Pode parecer contraintuitivo, mas um objetivo de 100% de confiabilidade geralmente não é a estratégia mais eficaz. Uma confiabilidade maior pode resultar em um custo significativamente maior, tanto em termos de investimento financeiro quanto de possíveis limitações na inovação. Se os usuários já estiverem satisfeitos com o nível atual de serviço, os esforços para aumentar ainda mais a satisfação poderão gerar um baixo retorno do investimento. Em vez disso, você pode gastar melhor os recursos em outros lugares.

É necessário determinar o nível de confiabilidade em que os usuários estão satisfeitos e o ponto em que o custo de melhorias incrementais começa a superar os benefícios. Ao determinar esse nível de confiabilidade suficiente, você pode alocar recursos estrategicamente e se concentrar em recursos e melhorias que oferecem maior valor aos usuários.

Recomendações

Para definir metas de confiabilidade realistas, considere as recomendações nas subseções a seguir.

Aceite algumas falhas e priorize componentes

Busque alta disponibilidade, como 99,99% de tempo de atividade, mas não defina uma meta de 100% de tempo de atividade. Reconheça que algumas falhas são inevitáveis.

A diferença entre 100% de tempo de atividade e uma meta de 99,99% é a tolerância a falhas. Essa diferença geralmente é chamada de margem de erro. A margem de erro pode ajudar você a assumir riscos e inovar, o que é fundamental para qualquer empresa se manter competitiva.

Priorize a confiabilidade dos componentes mais críticos do sistema. Aceite que componentes menos críticos podem ter uma tolerância maior a falhas.

Equilibrar confiabilidade e custo

Para determinar o nível ideal de confiabilidade do sistema, faça análises completas de custo-benefício.

Considere fatores como requisitos do sistema, as consequências de falhas e a tolerância a riscos da sua organização para o aplicativo específico. Lembre-se de considerar suas métricas de recuperação de desastres, como o objetivo do tempo de recuperação (RTO) e o objetivo do ponto de recuperação (RPO). Decida qual nível de confiabilidade é aceitável dentro do orçamento e outras restrições.

Procure maneiras de melhorar a eficiência e reduzir custos sem comprometer os recursos essenciais de confiabilidade.