Esse princípio no pilar de confiabilidade do Google Cloud Well-Architected Framework ajuda a avaliar a experiência do usuário e, em seguida, mapear as descobertas para metas e métricas de confiabilidade.
Esse princípio é relevante para a área de foco de escopo da confiabilidade.
Visão geral do princípio
As ferramentas de observabilidade fornecem grandes quantidades de dados, mas nem todos estão diretamente relacionados aos impactos nos usuários. Por exemplo, você pode observar alto uso da CPU, operações lentas do servidor ou até mesmo tarefas com falha. No entanto, se esses problemas não afetarem a experiência do usuário, eles não constituirão uma interrupção do serviço.
Para medir a experiência do usuário, é necessário distinguir entre o comportamento interno do sistema e os problemas voltados ao usuário. Concentre-se em métricas como a proporção de sucesso das solicitações do usuário. Não dependa apenas de métricas centradas no servidor, como o uso da CPU, que podem levar a conclusões enganosas sobre a confiabilidade do serviço. A verdadeira confiabilidade significa que os usuários podem usar seu aplicativo ou serviço de forma consistente e eficaz.
Recomendações
Para ajudar você a medir a experiência do usuário de maneira eficaz, considere as recomendações nas seções a seguir.
Medir a experiência do usuário
Para entender realmente a confiabilidade do serviço, priorize as métricas que refletem a experiência real dos usuários. Por exemplo, meça a proporção de sucesso da consulta dos usuários, a latência do aplicativo e as taxas de erro.
O ideal é coletar esses dados diretamente do dispositivo ou navegador do usuário. Se essa coleta direta de dados não for viável, mude o ponto de medição progressivamente mais longe do usuário no sistema. Por exemplo, é possível usar o balanceador de carga ou o serviço de front-end como ponto de medição. Essa abordagem ajuda a identificar e resolver problemas antes que eles possam afetar significativamente os usuários.
Analisar as jornadas do usuário
Para entender como os usuários interagem com o sistema, use ferramentas de geração de trace como o Cloud Trace. Ao acompanhar a jornada de um usuário pelo aplicativo, é possível encontrar gargalos e problemas de latência que podem prejudicar a experiência do usuário. O Cloud Trace captura dados de performance detalhados para cada hop na arquitetura de serviço. Esses dados ajudam a identificar e resolver problemas de desempenho com mais eficiência, o que pode levar a uma experiência do usuário mais confiável e satisfatória.