Criar painéis de controlo

Este documento mostra como criar um conjunto de painéis de controlo personalizados recomendados para monitorizar os seus clusters criados no Google Distributed Cloud (apenas software) para VMware.

Autorizações para criar painéis de controlo

Para criar painéis de controlo, a sua Conta Google tem de ter as seguintes autorizações para criar painéis de controlo:

  • monitoring.dashboards.create
  • monitoring.dashboards.delete
  • monitoring.dashboards.update

Tem estas autorizações se a sua conta tiver uma das seguintes funções. Pode verificar as suas autorizações (na Google Cloud consola):

  • monitoring.dashboardEditor
  • monitoring.editor
  • Projeto editor
  • Projeto owner

Além disso, para usar o gcloud (CLI gcloud) para criar painéis de controlo, a sua Conta Google tem de ter a autorização serviceusage.services.use.

A sua conta tem esta autorização se tiver uma das seguintes funções:

  • roles/serviceusage.serviceUsageConsumer
  • roles/serviceusage.serviceUsageAdmin
  • roles/owner
  • roles/editor
  • Projeto editor
  • Projeto owner

Depois de criar um cluster (administrador ou utilizador), uma prática recomendada é criar os seguintes painéis de controlo com o Cloud Monitoring para permitir que a sua equipa de operações monitorize o estado de funcionamento do cluster:

Se o cluster também executar nós do SO Windows Server, pode criar os seguintes painéis de controlo para monitorizar o estado dos nós e dos pods do Windows:

  • Painel de controlo de estado do nó do Windows
  • Painel de controlo de estado do agrupamento do Windows

Os painéis de controlo são criados automaticamente durante a instalação do cluster de administrador se o Cloud Monitoring estiver ativado.

Esta secção descreve como criar estes painéis de controlo. Para mais informações acerca do processo de criação de painéis de controlo descrito nas secções seguintes, consulte Gerir painéis de controlo por API.

Crie um painel de controlo do tempo de atividade do plano de controlo

O plano de controlo consiste no servidor de API, no programador, no gestor de controladores e no etcd. Para monitorizar o estado do plano de controlo, crie um painel de controlo que monitorize o estado destes componentes.

  1. Transfira a configuração do painel de controlo: control-plane-uptime.json.

  2. Crie um painel de controlo personalizado com o ficheiro de configuração executando o seguinte comando:

    gcloud monitoring dashboards create --config-from-file=control-plane-uptime.json
  3. Na Google Cloud consola, selecione Monitorização ou use o botão seguinte:

    Aceder a Monitorização

  4. Selecione Recursos > Painéis de controlo e veja o painel de controlo denominado Tempo de atividade do plano de controlo do GKE on-prem. O tempo de atividade do plano de controlo de cada cluster de utilizador é recolhido a partir de namespaces separados no cluster de administrador. O campo namespace_name é o nome do cluster de utilizadores.

  5. Opcionalmente, crie políticas de alerta.

Crie um painel de controlo do estado do pod

Para criar um painel de controlo que inclua a fase de cada Pod, bem como as horas de reinício e a utilização de recursos de cada contentor, siga estes passos.

  1. Transfira a configuração do painel de controlo: pod-status.json.

  2. Crie um painel de controlo personalizado com o ficheiro de configuração executando o seguinte comando:

    gcloud monitoring dashboards create --config-from-file=pod-status.json
  3. Na Google Cloud consola, selecione Monitorização ou use o botão seguinte:

    Aceder a Monitorização

  4. Selecione Recursos > Painéis de controlo e veja o painel de controlo denominado Estado do pod do GKE On-Prem.

  5. Opcionalmente, crie políticas de alerta.

Crie um painel de controlo do estado do nó

Para criar um painel de controlo do estado do nó para monitorizar a condição do nó, a CPU, a memória e a utilização do disco, execute os seguintes passos:

  1. Transfira a configuração do painel de controlo: node-status.json.

  2. Crie um painel de controlo personalizado com o ficheiro de configuração executando o seguinte comando:

    gcloud monitoring dashboards create --config-from-file=node-status.json
  3. Na Google Cloud consola, selecione Monitorização ou use o botão seguinte:

    Aceder a Monitorização

  4. Selecione Recursos > Painéis de controlo e veja o painel de controlo com o nome Estado do nó do GKE On-Prem.

  5. Opcionalmente, crie políticas de alerta.

Crie um painel de controlo do estado de saúde da VM

Um painel de controlo do estado de funcionamento da VM monitoriza os sinais de contenção de recursos de CPU, memória e disco para VMs no cluster de administrador e nos clusters de utilizador.

Para criar um painel de controlo do estado de funcionamento da VM:

  1. Certifique-se de que stackdriver.disableVsphereResourceMetrics está definido como falso. Consulte o ficheiro de configuração do cluster de utilizadores.

  2. Transfira a configuração do painel de controlo: vm-health-status.json.

  3. Crie um painel de controlo personalizado com o ficheiro de configuração executando o seguinte comando:

    gcloud monitoring dashboards create --config-from-file=vm-health-status.json
  4. Na Google Cloud consola, selecione Monitorização ou use o botão seguinte:

    Aceder a Monitorização

  5. Selecione Recursos > Painéis de controlo e veja o painel de controlo com o nome Estado de funcionamento da VM do GKE On-Prem.

  6. Opcionalmente, crie políticas de alerta.

Crie um painel de controlo de utilização de nós

Um painel de controlo de utilização de nós mostra a seguinte utilização no cluster:

  • Rácio de atribuição de CPU do nó
  • vCPUs disponíveis para agendar a carga de trabalho do Kubernetes
  • Rácio de atribuição de memória do nó
  • Memória disponível para agendar a carga de trabalho do k8s
  • Rácio de utilização do disco do nó

Para criar um painel de controlo de utilização de nós:

  1. Transfira a configuração do painel de controlo: node-utilization.json.

  2. Use este ficheiro de configuração para criar um painel de controlo personalizado executando o seguinte comando:

    gcloud monitoring dashboards create --config-from-file=node-utilization.json
  3. Na Google Cloud consola, selecione Monitorização ou use o botão seguinte:

    Aceder a Monitorização

  4. Selecione Recursos > Painéis de controlo e veja o painel de controlo com o nome Utilização de nós do GKE on-prem.

  5. Opcionalmente, crie políticas de alerta.

Crie um painel de controlo de medição da utilização do Anthos

Um painel de controlo de medição da utilização do Anthos mostra a utilização da CPU e da memória nos clusters por espaço de nomes e etiquetas de Pod.

Para criar um painel de controlo de medição da utilização do Anthos:

  1. Transfira a configuração do painel de controlo: anthos-utilization.json.

  2. Use este ficheiro de configuração para criar um painel de controlo personalizado executando o seguinte comando:

    gcloud monitoring dashboards create --config-from-file=anthos-utilization.json
  3. Na Google Cloud consola, selecione Monitorização ou use o botão seguinte:

    Aceder a Monitorização

  4. Selecione Recursos > Painéis de controlo e veja o painel de controlo denominado Medição da utilização do Anthos.

  5. Opcionalmente, crie políticas de alerta.