Esse princípio no pilar de confiabilidade do Google Cloud Well-Architected Framework ajuda você a avaliar a experiência dos usuários e mapear os resultados para metas e métricas de confiabilidade.
Esse princípio é relevante para a área de foco de escopo da confiabilidade.
Visão geral do princípio
As ferramentas de observabilidade fornecem grandes quantidades de dados, mas nem todos estão diretamente relacionados aos impactos nos usuários. Por exemplo, você pode observar alto uso da CPU, operações lentas do servidor ou até mesmo tarefas travadas. No entanto, se esses problemas não afetarem a experiência do usuário, eles não vão constituir uma interrupção do serviço.
Para medir a experiência do usuário, é preciso distinguir entre o comportamento interno do sistema e os problemas voltados ao usuário. Concentre-se em métricas como a proporção de sucesso das solicitações dos usuários. Não confie apenas em métricas relacionadas ao servidor, como o uso da CPU, que podem levar a conclusões enganosas sobre a confiabilidade do serviço. A verdadeira confiabilidade significa que os usuários podem usar seu aplicativo ou serviço de forma consistente e eficaz.
Recomendações
Para medir a experiência do usuário de maneira eficaz, considere as recomendações nas seções a seguir.
Medir a experiência do usuário
Para entender de verdade a confiabilidade do seu serviço, priorize métricas que reflitam a experiência real dos usuários. Por exemplo, meça a proporção de sucesso das consultas dos usuários, a latência do aplicativo e as taxas de erro.
O ideal é coletar esses dados diretamente do dispositivo ou navegador do usuário. Se essa coleta direta de dados não for viável, afaste progressivamente o ponto de medição do usuário no sistema. Por exemplo, é possível usar o balanceador de carga ou o serviço de front-end como ponto de medição. Essa abordagem ajuda a identificar e resolver problemas antes que eles afetem significativamente os usuários.
Analisar as jornadas dos usuários
Para entender como os usuários interagem com seu sistema, use ferramentas de rastreamento como o Cloud Trace. Ao acompanhar a jornada de um usuário no seu aplicativo, é possível encontrar gargalos e problemas de latência que podem prejudicar a experiência dele. O Cloud Trace captura dados de performance detalhados para cada hop na arquitetura de serviço. Esses dados ajudam a identificar e resolver problemas de performance com mais eficiência, o que pode levar a uma experiência do usuário mais confiável e satisfatória.