Otimizar e monitorar os custos do Google Cloud Observability

Nesta página, descrevemos como otimizar e monitorar os custos do Google Cloud Observability. Para informações sobre preços, consulte Preços do Google Cloud Observability.

Talvez você também tenha interesse nos seguintes documentos:

Estime suas contas.
Exemplos de preços.
Otimize os custos com o Cost Explorer. O Cost Explorer fornece visualizações atuais e históricas de dados de custos e métricas de utilização. Assim, os dados ajudam você a identificar oportunidades de otimização.

Otimizar

Nesta seção, você encontra orientações sobre como reduzir ou otimizar os custos associados ao Cloud Logging, ao Cloud Trace e ao Google Cloud Managed Service para Prometheus.

Reduzir os custos do Cloud Logging

Para reduzir os custos de armazenamento do Cloud Logging, configure filtros de exclusão nos coletores de registros para impedir que entradas de registro de baixo valor sejam transmitidas para os buckets de registros. É possível configurar um coletor de registros para excluir todas as entradas de registro que correspondem a um filtro de exclusão ou para excluir apenas uma porcentagem das entradas de registro correspondentes. As entradas de registro excluídas não são transmitidas para seus buckets de registros e não são contabilizadas na cota de armazenamento. Para saber mais, consulte Filtros de gravador de registros.

Os custos de armazenamento do Cloud Logging se aplicam apenas aos dados de registros armazenados em buckets de registros. É possível configurar seus gravadores de registros para que os dados não sejam armazenados em buckets de registros, mas encaminhados para um dos seguintes destinos:

O Cloud Logging não cobra pelo encaminhamento de entradas de registro para os destinos listados. No entanto, você pode receber uma cobrança quando as entradas de registro são recebidas por um destino.

Para informações sobre como rotear dados de registros, consulte Rotear registros para destinos compatíveis.

Otimizar custos do Managed Service para Prometheus

Os preços do Managed Service para Prometheus foram projetados para serem controláveis. Como as cobranças são geradas por amostra, use os seguintes fatores para controlar os custos:

Período de amostragem: alterar o período de extração de métricas de 15 segundos para 60 segundos pode gerar uma economia de 75%, sem sacrificar a cardinalidade. É possível configurar períodos de amostragem por job, por destino ou global.
Filtragem: é possível usar a filtragem para reduzir o número de amostras enviadas ao armazenamento de dados global do serviço. Para mais informações, consulte Como filtrar métricas exportadas. Use configurações de remarcação de métricas na configuração de extração do Prometheus para descartar métricas no momento da ingestão, com base em correspondências de rótulos.
Mantenha os dados de alta cardinalidade e de baixo valor locais. É possível executar o Prometheus padrão com o serviço gerenciado, usando as mesmas configurações de verificação, e manter os dados no local que não vale a pena enviar para o repositório de dados global do serviço.

Os preços do Managed Service para Prometheus foram projetados para serem previsíveis.

Você não recebe penalizações por ter histogramas esparsos. As amostras são contadas apenas para o primeiro valor diferente de zero e, em seguida, quando o valor do bucket_n é maior que o valor no bucket_n-1. Por exemplo, um histograma com valores 10 10 13 14 14 14 conta como três amostras, para o primeiro, terceiro e quarto buckets.

Dependendo de quantos histogramas você usa e para que eles são usados, a exclusão de buckets inalterados dos preços geralmente pode fazer com que 20% a 40% menos amostras sejam contadas para fins de faturamento do que o número absoluto de buckets de histograma indicaria.
Ao cobrar por amostra, você não receberá penalizações por contêineres com escalonamento rápido e não escalonados, preemptivos ou temporários, como os criados pelo HPA ou pelo Autopilot do GKE.

Se o Managed Service para Prometheus cobrasse por métrica, você pagaria pela cardinalidade de um mês inteiro, de uma só vez, sempre que um novo contêiner fosse gerado. Com o preço por amostra, você paga apenas enquanto o contêiner está em execução.

Consultas, incluindo consultas de alerta

Todas as consultas emitidas pelo usuário, incluindo as emitidas quando as regras de gravação do Prometheus são executadas, são cobradas usando as chamadas da API Cloud Monitoring.

Reduzir o uso do Trace

Para controlar o volume de ingestão de períodos do Trace, gerencie a taxa de amostragem de traces. Assim, será possível equilibrar a quantidade necessária para analisar o desempenho com a tolerância de custo.

Para sistemas de tráfego intenso, a maioria dos clientes pode coletar amostras de uma em 1.000 transações, ou até uma em 10.000 transações, e ainda ter informações suficientes para analisar o desempenho.

A taxa de amostragem é configurada com as bibliotecas de cliente do Cloud Trace.

Reduza sua fatura de alertas

Nesta seção, descrevemos estratégias que podem ser usadas para reduzir os custos dos alertas.

Consolidar políticas de alertas para operar em mais recursos

O serviço de alertas cobra um custo por condição. Por isso, quando possível, use uma política de alertas para monitorar vários recursos em vez de criar uma para cada recurso.

Por exemplo, suponha que você tenha 100 VMs. Cada VM gera uma série temporal para o tipo de métrica my_metric. Confira duas maneiras diferentes de monitorar a série temporal:

Você cria uma política de alertas com uma condição. A condição monitora my_metric e agrega dados no nível da VM. Após a agregação, há uma série temporal para cada VM. Portanto, a condição monitora 100 série temporal.
Você cria 100 políticas de alertas, e cada uma contém uma condição. Cada condição monitora a série temporal my_metric de uma das VMs e agrega dados no nível da VM. Portanto, cada condição monitora uma série temporal.

A segunda opção, que cria 100 condições, é mais cara do que a primeira, que cria apenas uma condição. As duas opções monitoram 100 série temporal.

Agregue apenas ao nível em que você precisa gerar um alerta

Há um custo para cada série temporal monitorada por uma política de alertas. A agregação em níveis mais altos de granularidade resulta em custos maiores do que a agregação em níveis mais baixos. Por exemplo, agregar ao nível do projeto Google Cloud é mais barato do que agregar ao nível do cluster, e agregar ao nível do cluster é mais barato do que agregar ao nível do cluster e do namespace.

Por exemplo, suponha que você tenha 100 VMs. Cada VM gera uma série temporal para o tipo de métrica my_metric. Cada uma das suas VMs pertence a um dos cinco serviços. Você decide criar uma política de alertas com uma condição que monitora my_metric. Confira duas opções de agregação diferentes:

Você agrega dados ao serviço. Após a agregação, há uma série temporal para cada serviço. Portanto, a condição monitora cinco série temporal.
Você agrega dados no nível da VM. Após a agregação, há uma série temporal para cada VM. Portanto, a condição monitora 100 série temporal.

A segunda opção, que monitora 100 série temporal, é mais cara do que a primeira, que monitora apenas cinco.

Ao configurar as políticas de alerta, escolha níveis de agregação que funcionem melhor para seu caso de uso. Por exemplo, se você se importa com alertas sobre a utilização da CPU, talvez queira agregar no nível da VM e da CPU. Se você se importa com alertas de latência por serviço, talvez queira agregar ao nível de serviço.

Não gere alertas sobre dados brutos e não agregados

O Monitoring usa um sistema de métricas dimensionais, em que qualquer métrica tem cardinalidade total igual ao número de recursos monitorados multiplicado pelo número de combinações de rótulos nessa métrica. Por exemplo, se você tiver 100 VMs emitindo uma métrica, e essa métrica tiver 10 rótulos com 10 valores cada, a cardinalidade total será 100 * 10 * 10 = 10.000.

Como resultado da forma como a cardinalidade é dimensionada, o alerta sobre dados brutos pode ser extremamente caro. No exemplo anterior, você tem 10.000 série temporal retornadas para cada período de execução. No entanto, se você agregar à VM, terá apenas 100 série temporal retornadas por período de execução, independente da cardinalidade do rótulo dos dados subjacentes.

Alertar sobre dados brutos também aumenta o risco de aumento da série temporal quando as métricas recebem novos rótulos. No exemplo anterior, se um usuário adicionar um novo rótulo à sua métrica, a cardinalidade total aumentará para 100 * 11 * 10 = 11.000 série temporal. Nesse caso, o número de série temporal retornadas aumenta em 1.000 a cada período de execução,mesmo que a política de alertas não seja alterada. Se você agregar à VM, apesar do aumento na cardinalidade subjacente, ainda terá apenas 100 série temporal retornadas.

Filtrar respostas desnecessárias

Configure as condições para avaliar apenas os dados necessários para suas necessidades de alerta. Se você não tomaria medidas para corrigir algo, exclua isso das suas políticas de alertas. Por exemplo, provavelmente não é necessário gerar um alerta em uma VM de desenvolvimento de um estagiário.

Para reduzir incidentes e custos desnecessários, filtre as série temporal que não são importantes. É possível usar rótulos de metadados Google Cloud para incluir tags em recursos com categorias e filtrar as categorias de metadados desnecessárias.

Use operadores de fluxo superior para reduzir o número de série temporal retornadas

Se a condição usar uma consulta PromQL, você poderá usar um operador "top-streams" para selecionar um número das série temporal retornadas com os valores mais altos:

PromQL: topk

Por exemplo, uma cláusula topk(metric, 5) em uma consulta do PromQL limita o número de série temporal retornadas a cinco em cada período de execução.

Limitar a um número máximo de série temporal pode resultar em dados ausentes e incidentes incorretos, como:

Se mais de N série temporal violarem o limite, você vai perder dados fora das N principais série temporal.
Se uma série temporal violadora ocorrer fora das N principais, os incidentes poderão ser fechados automaticamente, mesmo que a série excluída ainda viole o limite.
Suas consultas de condição podem não mostrar um contexto importante, como série temporal de base que estão funcionando conforme o esperado.

Para reduzir esses riscos, escolha valores grandes para N e use o operador top-streams apenas em políticas de alertas que avaliam muitas série temporal, como incidentes para contêineres individuais do Kubernetes.

Aumentar o período de execução (somente PromQL)

Se a condição usar uma consulta do PromQL, você poderá modificar a duração do período de execução definindo o campo evaluationInterval na condição.

Intervalos de avaliação mais longos resultam em menos série temporal retornadas por mês. Por exemplo, uma consulta de condição com um intervalo de 15 segundos é executada duas vezes mais do que uma consulta com um intervalo de 30 segundos, e uma consulta com um intervalo de 1 minuto é executada metade das vezes de uma consulta com um intervalo de 30 segundos.

Monitoramento

Nesta seção, descrevemos como monitorar seus custos criando políticas de alertas. Uma política de alertas pode monitorar dados de métricas e notificar você quando eles ultrapassarem um limite.

Monitorar bytes de registro mensais ingeridos

Para criar uma política de alertas que seja acionada quando o número de bytes de registro gravados nos seus buckets de registro exceder o limite definido pelo usuário para o Cloud Logging, use as configurações abaixo.

Etapas para criar uma política de alertas.

Para criar uma política de alertas, siga estas etapas:

No console do Google Cloud , acesse a página Alertas:
Acessar Alertas

Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.
Se você ainda não criou canais de notificação e desejar recebê-las, clique em Editar canais de notificação e adicione seus canais. Retorne para a página Alertas depois de adicionar seus canais.
Na página Alertas, clique em Criar política.
Para selecionar o recurso, a métrica e os filtros, expanda o menu Selecionar uma métrica e use os valores na tabela Nova condição:
1. (Opcional) Para limitar o menu a entradas relevantes, insira o nome do recurso ou da métrica na barra de filtro.
2. Selecione um Tipo de recurso. Por exemplo, selecione Instância de VM.
3. Selecione uma Categoria de métrica. Por exemplo, selecione instância.
4. Selecione uma Métrica. Por exemplo, selecione CPU Utilization.
5. Selecione Apply.
Clique em Avançar e configure o acionador da política de alertas. Para preencher esses campos, use os valores na tabela Configurar gatilho de alerta.
Clique em Próxima.
Opcional: para adicionar notificações à política de alertas, clique em Canais de notificação. Na caixa de diálogo, selecione um ou mais canais de notificação no menu e clique em OK.

(Opcional) Para receber uma notificação quando os incidentes forem abertos ou fechados, marque Notificar sobre o fechamento de incidentes. Por padrão, as notificações são enviadas apenas quando incidentes são abertos.
Opcional: Atualize a Duração do fechamento automático do incidente. Este campo determina quando o Monitoring fecha incidentes na ausência de dados de métrica.
Opcional: clique em Documentação e adicione as informações que quer incluir em uma mensagem de notificação.
Clique em Nome do alerta e insira um nome para a política de alertas.
Clique em Criar política.

Novo estado Campo	Valor
Recurso e métrica	No menu Recursos, selecione Global. No menu Categorias de métrica, selecione Métrica com base em registros. No menu Métricas, selecione Bytes de registros ingeridos por mês.
Filtrar	Nenhuma.
Várias séries Agregação de série temporal	`sum`
Janela contínua	`60 m`
Função de janela contínua	`max`

Campo Configurar gatilho de alerta	Valor
Tipo de condição	`Threshold`
Acionador de alerta	`Any time series violates`
Posição do limite	`Above threshold`
Valor do limite	Você determina o valor aceitável.
Teste a janela novamente	O valor mínimo aceitável é de 30 minutos.

Monitorar o total de métricas ingeridas

Não é possível criar um alerta com base nas métricas ingeridas mensalmente. No entanto, é possível fazer isso para seus custos com o Cloud Monitoring. Para mais informações, consulte Configurar um alerta de faturamento.

Monitorar períodos de trace ingeridos mensalmente

Para criar uma política de alertas acionada quando os períodos mensais do Cloud Trace ingeridos ultrapassarem um limite definido pelo usuário, use as configurações abaixo.

Etapas para criar uma política de alertas.

Para criar uma política de alertas, siga estas etapas:

No console do Google Cloud , acesse a página Alertas:
Acessar Alertas

Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.
Se você ainda não criou canais de notificação e desejar recebê-las, clique em Editar canais de notificação e adicione seus canais. Retorne para a página Alertas depois de adicionar seus canais.
Na página Alertas, clique em Criar política.
Para selecionar o recurso, a métrica e os filtros, expanda o menu Selecionar uma métrica e use os valores na tabela Nova condição:
1. (Opcional) Para limitar o menu a entradas relevantes, insira o nome do recurso ou da métrica na barra de filtro.
2. Selecione um Tipo de recurso. Por exemplo, selecione Instância de VM.
3. Selecione uma Categoria de métrica. Por exemplo, selecione instância.
4. Selecione uma Métrica. Por exemplo, selecione CPU Utilization.
5. Selecione Apply.
Clique em Avançar e configure o acionador da política de alertas. Para preencher esses campos, use os valores na tabela Configurar gatilho de alerta.
Clique em Próxima.
Opcional: para adicionar notificações à política de alertas, clique em Canais de notificação. Na caixa de diálogo, selecione um ou mais canais de notificação no menu e clique em OK.

(Opcional) Para receber uma notificação quando os incidentes forem abertos ou fechados, marque Notificar sobre o fechamento de incidentes. Por padrão, as notificações são enviadas apenas quando incidentes são abertos.
Opcional: Atualize a Duração do fechamento automático do incidente. Este campo determina quando o Monitoring fecha incidentes na ausência de dados de métrica.
Opcional: clique em Documentação e adicione as informações que quer incluir em uma mensagem de notificação.
Clique em Nome do alerta e insira um nome para a política de alertas.
Clique em Criar política.

Novo estado Campo	Valor
Recurso e métrica	No menu Recursos, selecione Global. No menu Categorias de métrica, selecione Faturamento. No menu Métricas, selecione Intervalos de rastreamento mensais ingeridos.
Filtrar
Várias séries Agregação de série temporal	`sum`
Janela contínua	`60 m`
Função de janela contínua	`max`

Campo Configurar gatilho de alerta	Valor
Tipo de condição	`Threshold`
Acionador de alerta	`Any time series violates`
Posição do limite	`Above threshold`
`Threshold value`	Você determina o valor aceitável.
Teste a janela novamente	O valor mínimo aceitável é de 30 minutos.

Configurar um alerta de faturamento

Para receber notificações caso as cobranças faturáveis ou previstas ultrapassem um orçamento, crie um alerta na página Orçamentos e alertas do console Google Cloud :

No console Google Cloud , acesse a página Faturamento:
Vá para Faturamento

Também é possível encontrar essa página usando a barra de pesquisa.

Se você tiver mais de uma conta do Cloud Billing, siga uma das orientações a seguir:
- Para gerenciar o Cloud Billing no projeto atual, selecione Acessar a conta de faturamento vinculada.
- Para localizar outra conta do Cloud Billing, selecione Gerenciar contas de faturamento e escolha a opção em que você quer definir um orçamento.
No menu de navegação de faturamento, selecione Orçamentos e alertas.
Clique em Criar orçamento.
Preencha a caixa de diálogo do orçamento. Nesse campo, selecione projetos e produtos do Google Cloud e depois crie um orçamento para a combinação. Google Cloud Por padrão, você recebe notificações ao atingir 50%, 90% e 100% do orçamento. Para ver a documentação completa, consulte Definir orçamentos e alertas.
Observação:na caixa de diálogo de faturamento, use as seguintes configurações:
- Para criar um alerta sobre o uso do Cloud Logging, selecione Cloud Logging
- Para criar um alerta sobre o uso do Cloud Monitoring, selecione Stackdriver Monitoring.
- Para criar um alerta sobre o uso do Cloud Trace, selecione Stackdriver Trace

Otimizar e monitorar os custos do Google Cloud Observability Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Otimizar

Reduzir os custos do Cloud Logging

Otimizar custos do Managed Service para Prometheus

Reduzir o uso do Trace

Reduza sua fatura de alertas

Consolidar políticas de alertas para operar em mais recursos

Agregue apenas ao nível em que você precisa gerar um alerta

Não gere alertas sobre dados brutos e não agregados

Filtrar respostas desnecessárias

Use operadores de fluxo superior para reduzir o número de série temporal retornadas

Aumentar o período de execução (somente PromQL)

Monitoramento

Monitorar bytes de registro mensais ingeridos

Etapas para criar uma política de alertas.

Monitorar o total de métricas ingeridas

Monitorar períodos de trace ingeridos mensalmente

Etapas para criar uma política de alertas.

Configurar um alerta de faturamento

Otimizar e monitorar os custos do Google Cloud Observability