Esta página descreve as práticas recomendadas para garantir a alta disponibilidade da sua instalação do Google Distributed Cloud. A Distributed Cloud não oferece um contrato de nível de serviço (SLA) e disponibiliza apenas o objetivo de nível de serviço (SLO) descrito nesta página.
Escolher e implementar o nível de disponibilidade
Escolha o nível de disponibilidade para suas cargas de trabalho do Distributed Cloud que melhor atende aos requisitos da sua empresa. Por exemplo, um aplicativo de autoatendimento em uma loja de varejo tem um risco de disponibilidade muito menor do que uma implantação de RAN de borda de uma operadora de rede celular.
A disponibilidade desejada é diretamente proporcional à capacidade de recursos sobressalentes do Distributed Cloud que você reserva para emergências. A tabela a seguir descreve essa relação. Essas estimativas não incluem o tempo de inatividade programado com uma janela de manutenção.
O software do Distributed Cloud Connected consome alguns recursos em cada máquina física. O valor varia de acordo com a configuração específica da implantação conectada do Distributed Cloud. O Google recomenda que você faça um comparativo de mercado da implantação do Distributed Cloud Connected para medir esse valor e considerá-lo ao planejar a distribuição da carga de trabalho.
| Capacidade em uso | Capacidade reservada | Disponibilidade de destino |
|---|---|---|
| 83,33% | 16,67% | 99,9% |
| 100% | 0% | 93,5% |
Você pode ter uma perda repentina de capacidade devido a uma falha de hardware ou um nó que precisa ser reiniciado. Para se preparar para isso, você precisa arquitetar suas cargas de trabalho com cotas de recursos em mente para sempre ter capacidade disponível em cada nó do Distributed Cloud que atenda ao nível de disponibilidade escolhido.
Por exemplo, para alcançar uma disponibilidade de destino de 99,9%, configure suas cargas de trabalho para que uma das seis máquinas físicas em cada cluster do Distributed Cloud esteja disponível como backup.
Usar o modo de capacidade de sobrevivência
Com o Distributed Cloud, é possível criar clusters que usam um plano de controle local executado no hardware do Distributed Cloud. Esses clusters permitem que as cargas de trabalho continuem sendo executadas quando a conexão com Google Cloud é perdida. Para mais informações, consulte Modo de capacidade de sobrevivência do Distributed Cloud.
Entender as atualizações de software e as janelas de manutenção
O Google atualiza regularmente o software do Distributed Cloud. Essas atualizações de software são obrigatórias e não podem ser desativadas. Com o Distributed Cloud, é possível especificar janelas de manutenção individuais para cada um dos seus clusters do Distributed Cloud.
Para reduzir possíveis interrupções temporárias nas cargas de trabalho, as janelas de manutenção permitem controlar quando os upgrades automáticos de planos de controle e nós podem ocorrer. As janelas de manutenção são úteis para os seguintes tipos de cenários, entre outros:
- Fora dos horários de pico: minimize a chance de inatividade programando os upgrades automáticos fora dos horários de pico, quando o tráfego é reduzido.
- Em serviço: garanta que os upgrades aconteçam durante as horas de trabalho para que alguém possa monitorá-los e gerenciar problemas imprevistos.
- Upgrades de vários clusters: implemente upgrades em vários clusters em diferentes regiões, uma de cada vez, em intervalos especificados.
Além dos upgrades automáticos, é possível que o Google precise realizar outras tarefas de manutenção de vez em quando. Nesses casos, ela respeita a janela de manutenção de um cluster quando possível.
Se as tarefas forem executadas fora da janela de manutenção, o Distributed Cloud tentará pausá-las. Em seguida, ele tenta retomar essas tarefas durante a próxima janela de manutenção.
O Distributed Cloud reserva-se o direito de lançar upgrades de emergência não planejados fora das janelas de manutenção. Além disso, os upgrades obrigatórios de software descontinuado ou desatualizado podem ocorrer automaticamente fora das janelas de manutenção.
Você também pode fazer upgrade manual do cluster quando quiser. Esses upgrades começam imediatamente e ignoram todas as janelas de manutenção.
Para saber como configurar uma janela de manutenção para um cluster novo ou atual, consulte Configurar uma janela de manutenção.
Restrições
As janelas de manutenção têm as seguintes restrições:
Uma janela de manutenção por cluster. Só é possível configurar uma única janela de manutenção por cluster. A configuração de uma nova janela de manutenção substitui a anterior.
Fusos horários para janelas de manutenção. Ao configurar e visualizar janelas de manutenção, os horários são mostrados de maneira diferente, dependendo da ferramenta usada, conforme detalhado nas seções a seguir.
Ao configurar janelas de manutenção
Quando você usa a sinalização --maintenance-window mais genérica para configurar uma
janela de manutenção, não é possível especificar um fuso horário. Ao usar a
Google Cloud CLI ou a API, o UTC é usado para mostrar os horários. O console do
Google Cloud usa o fuso horário local para mostrar os horários.
Ao usar flags mais granulares, como --maintenance-window-start, é possível especificar o fuso horário como parte do valor. Se você omitir o fuso horário, o
fuso horário local será usado. Os horários são sempre armazenados em UTC.
Ao visualizar janelas de manutenção
Ao visualizar informações sobre o cluster, os carimbos de data/hora das janelas de manutenção podem ser mostrados em UTC ou no fuso horário local, dependendo de como você estiver visualizando as informações:
- Ao usar o console Google Cloud para ver informações sobre o cluster, os horários são sempre exibidos no fuso horário local.
- Ao usar a CLI gcloud para visualizar informações sobre o cluster, os horários são sempre exibidos em UTC.
Em ambos os casos, o RRULE está sempre em UTC. Isso significa que se forem especificados, por
exemplo, dias da semana, esses dias estarão em UTC.
Configurar janelas de manutenção do cluster
Com o Distributed Cloud, é possível especificar uma janela de manutenção para cada um dos seus clusters do Distributed Cloud. Essa janela informa ao Google para atualizar o software do Distributed Cloud apenas durante o período e na frequência especificados.
As regras a seguir regem as janelas de manutenção do cluster do Distributed Cloud:
- Se você especificar uma janela de manutenção para um cluster do Distributed Cloud, o Google vai atualizar o software do Distributed Cloud 48 horas depois que a atualização for anunciada nas notas da versão do Distributed Cloud. Na página das notas da versão, você pode assinar o feed RSS das notas da versão do Distributed Cloud para ficar por dentro das atualizações de software assim que forem lançadas.
- A duração mínima de uma janela de manutenção é de seis horas. É possível especificar uma janela mais longa com base na complexidade da instalação do Distributed Cloud e nos requisitos de negócios.
- A frequência mínima de atualizações de software é uma vez por semana. É possível especificar janelas de manutenção semanais ou diárias. É possível incluir e excluir dias específicos.
- É possível mudar a programação da janela de manutenção de um cluster a qualquer momento, exceto quando uma janela de manutenção já foi programada ou está em andamento.
- Se a atualização de software não for concluída dentro do período especificado, ela será pausada e retomada durante a próxima janela de manutenção programada.
Para instruções detalhadas, consulte Configurar uma janela de manutenção para um cluster.
Conserto de hardware com falha
Quando o Google detecta uma falha no hardware do Distributed Cloud, ele tenta agendar uma visita ao local em até três dias úteis. Para que um técnico autorizado pelo Google faça o diagnóstico e os reparos necessários, você precisa conceder acesso ao hardware do Distributed Cloud.
Se ocorrer uma falha no hardware do Distributed Cloud e o Google realizar reparos no local, todas as mídias de armazenamento serão removidas da máquina do Distributed Cloud em manutenção e ficarão sob sua custódia durante o reparo.
Outros pontos de falha
Você é responsável por manter os seguintes aspectos da sua instalação do Distributed Cloud que estão fora do controle do Google e podem afetar a disponibilidade do Distributed Cloud:
- Todos os dados que você escolher armazenar no hardware do Distributed Cloud. Isso inclui backups redundantes em funcionamento e a exportação dos dados antes de devolver o hardware do Distributed Cloud ao Google.
- Fonte de alimentação elétrica.
- Temperatura, umidade e resfriamento do ambiente.
- Segurança de hardware físico.
- Segurança de rede local.
- Rede local e conectividade com a Internet. O Distributed Cloud requer uma conexão constante com Google Cloud e não pode funcionar sem ela.