Nesta página, explicamos alguns aspectos a serem considerados ao configurar os serviços do Cloud Run. Não existe uma solução única para otimização de custos. É importante monitorar suas necessidades, orçamento e recursos para determinar o que funciona melhor para você.
As práticas recomendadas descritas neste documento são específicas do Cloud Run. Eles não incluem outros produtos Google Cloud .
Configurações de recursos
Para otimizar os custos dos serviços, é preciso considerar várias configurações diferentes. Adapte essas configurações às suas necessidades para criar serviços confiáveis e econômicos.
Selecionar a região apropriada
O local de implantação do serviço afeta o custo total. O Cloud Run usa um modelo de preços regional de dois níveis. As regiões de nível 1 oferecem um custo menor por vCPU e memória em comparação com as regiões de nível 2. Portanto, considere fazer a implantação em uma região de nível 1.
Autenticação necessária
Ao configurar um serviço do Cloud Run, é possível escolher uma das duas opções de autenticação:
- Permitir acesso público: não é necessário fazer verificações de autenticação.
- Exigir autenticação: somente usuários autenticados podem acessar seu serviço do Cloud Run.
Recomendamos exigir autenticação, a menos que você tenha uma necessidade específica de permitir acesso público. Isso evita solicitações indesejadas que podem gerar custos.
Se você gerenciar usuários com o Identity-Aware Proxy (IAP), talvez ele tenha custos associados.
Comparar o faturamento baseado em instância com o baseado em solicitação
Os serviços do Cloud Run têm duas configurações de faturamento:
- Faturamento com base em solicitações (padrão): você paga por solicitação, além de uma taxa por segundo mais alta para vCPU e memória consumidas durante o processamento da solicitação.
- Faturamento com base em instâncias: a cobrança é feita durante todo o ciclo de vida de uma instância. Não há taxa por solicitação, e as taxas por segundo para vCPU e memória são menores.
Para serviços com tráfego estável e de variação lenta, considere usar o faturamento com base em instâncias. A economia com taxas de computação mais baixas e sem taxa por solicitação supera o custo de pagar pelo tempo inativo entre as solicitações. Para serviços com tráfego esporádico, intermitente ou instável, considere usar o faturamento baseado em solicitações. Se você ainda não tiver certeza de qual configuração de faturamento usar, consulte Recomendador. O Recommender analisa o tráfego recebido pelo serviço do Cloud Run no último mês e oferece recomendações para mudar do faturamento baseado em solicitações para o faturamento baseado em instâncias, se for mais barato.
Configurar o escalonamento de serviços no nível do serviço
Para estabelecer uma base de segurança de custos, configure o número máximo de instâncias do serviço. Definir um número máximo maior prioriza a disponibilidade, mas introduz possíveis riscos de faturamento devido a picos de tráfego inesperados ou configurações incorretas. Configure essa definição no nível do serviço quando implantar o serviço inicialmente para estabelecer um valor de referência de custo. Para outras ferramentas de controle de custos, consulte cotas de alocação de recursos ou orçamentos e alertas de faturamento.
Otimizar o uso da CPU e da memória
O custo do serviço do Cloud Run é afetado pela configuração de CPU/memória e pelo tempo de atividade do serviço, entre outros fatores. O provisionamento em excesso dos recursos pode aumentar seus custos. Para determinar qual configuração é a melhor para seu serviço:
- Estabeleça uma configuração de referência.
- Monitore suas métricas enquanto testa as métricas de utilização de CPU e memória no Cloud Monitoring.
- Ajuste a configuração conforme necessário.
Se a utilização da CPU for consistentemente baixa sob carga máxima, considere reduzir a alocação de vCPUs. Se a latência for alta, considere aumentar a alocação de vCPU.
Se a utilização da memória for consistentemente baixa, considere reduzir a memória alocada. Se a latência for alta e a utilização da memória estiver perto de 100%, considere aumentar a memória alocada. Se você estiver enfrentando erros de falta de memória (OOM), aumente a memória alocada ou modifique o aplicativo para evitar vazamentos de memória ou usar menos memória. Consulte o painel do Cloud Monitoring para entender melhor a utilização da memória.
Configurar GPU
Todos os serviços do Cloud Run que usam GPUs precisam ter o faturamento baseado em instância configurado. Isso significa que as instâncias do Cloud Run são cobradas por todo o ciclo de vida das instâncias, mesmo quando não há solicitações recebidas. As configurações mínimas de CPU e memória necessárias para GPUs também afetam o custo do seu serviço do Cloud Run. Por padrão, a redundância zonal de GPU está ativada. Desativar a redundância zonal da GPU resulta em um custo menor por segundo de GPU, mas não garante capacidade reservada para cenários de failover.
Otimizar custos de rede
Ao configurar as opções de rede para seu serviço, considere o seguinte:
- Coloque seus recursos no mesmo local: tente implantar seus serviços do Cloud Run na mesma região dos bancos de dados de back-end (como Cloud SQL ou Firestore) e dos buckets do Cloud Storage. A transferência de dados entre recursos do Google Cloud na mesma região não tem custo financeiro.
- Mude para a saída direta da VPC: se você estiver roteando o tráfego com segurança para recursos internos da rede VPC, considere mudar para a saída direta da VPC em vez de usar conectores de acesso VPC sem servidor. A saída direta de VPC é escalonada para zero, eliminando a sobrecarga de computação básica e os custos ociosos associados às instâncias de conector.
- Use o Cloud CDN: descarregue recursos estáticos e conteúdo altamente armazenável em cache colocando o Cloud CDN na frente dos seus serviços do Cloud Run. A veiculação de dados da borda é muito mais barata do que pagar pela saída padrão da Internet diretamente do Cloud Run.
- Monitore a saída da Internet: o tráfego de entrada (ingress) é sempre sem custo financeiro, e você recebe 1 GiB de transferência de dados de saída da Internet por mês na América do Norte. Concentre seus esforços de monitoramento no tráfego de saída que cruza os limites da região ou excede o nível sem custo financeiro.
Definir configurações de simultaneidade
Quando mais instâncias processam solicitações, o Cloud Run aloca mais CPU e memória a custos mais altos. Uma configuração de simultaneidade mais alta permite que menos instâncias processem o mesmo volume de solicitações, o que pode reduzir os custos. No entanto, o código do aplicativo precisa processar solicitações paralelas de maneira eficiente. Para mais informações, consulte Ajustar a simultaneidade para escalonamento automático e utilização de recursos.
Descontos por compromisso de uso
Os descontos por compromisso de uso (CUDs) oferecem preços com desconto em troca do compromisso de usar continuamente o Cloud Run por um período especificado. Os CUDs são aplicados no nível da conta do Cloud Billing. É possível comprar CUDs flexíveis do Compute para recursos do Cloud Run. Os CUDs flexíveis de computação não se aplicam a GPUs ou redes. Consulte desconto por compromisso de uso flexível do Compute para mais detalhes.
Ferramentas úteis
Use as ferramentas a seguir para entender melhor seus custos e evitar estouros.
Visão geral do Cloud Run: painel de faturamento
A página de visão geral do Cloud Run mostra os custos por nome de recurso no painel de faturamento. Os números refletem os custos brutos dos períodos selecionados por recurso. Essa ferramenta ajuda você a entender melhor o custo dos seus recursos.
Alertas orçamentários
Crie alertas de orçamento no Cloud Billing para acompanhar os custos reais em relação aos custos planejados. Um orçamento é um mecanismo de alerta que aciona notificações quando os limites de gastos são ultrapassados, não um gasto máximo. Há um atraso nos dados de faturamento que pode afetar o recebimento de alertas.
Cloud Billing
O Cloud Billing é um conjunto de ferramentas que ajuda a monitorar e entender seus gastos com o Google Cloud . Essas ferramentas ajudam você a monitorar os custos de uso, prever gastos e identificar oportunidades de economizar.
Explorador de custos
Com o Cost Explorer, você entende o custo e a utilização dos seus recursos. Use o Explorador de custos para:
- Filtre seus recursos por custo para saber quais são os mais caros.
- Entenda qual proporção dos custos é impulsionada por configurações como vCPU, GPU, rede e muito mais.
- Acompanhe os impactos das mudanças na configuração de recursos na sua fatura mensal.
Google Cloud calculadora de preços
A visão geral de preços doGoogle Cloud contém informações para entender melhor o modelo de preços do Google Cloud . É também aqui que você encontra a Lista de preços detalhada. Estime seus custos adicionando e configurando produtos com a calculadora de preços.
Recomendador
O Recomendador é uma ferramenta que fornece recomendações de uso e insights para produtos do Cloud.
O recomendador analisa automaticamente o tráfego recebido pelo serviço do Cloud Run no último mês e recomenda a mudança do faturamento com base em solicitações para o faturamento com base em instâncias, se for mais barato.Otimização do Cloud Hub
Na página de otimização do Cloud Hub, é possível conferir dados resumidos de custo e utilização, além de recomendações de otimização de custos para serviços do Google Cloud .