Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Acelere o desempenho de leitura de cargas de trabalho com estado usando o cache de dados do GKE

Padrão

Este guia descreve como melhorar a performance de aplicativos com estado que exigem muita leitura usando o GKE Data Cache nos clusters do Google Kubernetes Engine (GKE). O GKE Data Cache é uma solução de armazenamento em blocos gerenciada que acelera as operações de leitura para aplicativos com estado, como bancos de dados, que são executados no GKE.

Só é possível usar o Data Cache com clusters GKE Standard. Este guia orienta você na ativação do GKE Data Cache ao criar um novo cluster padrão do GKE ou um pool de nós e no provisionamento de discos anexados do GKE com aceleração do Data Cache.

Sobre o GKE Data Cache

Com o GKE Data Cache, é possível usar SSDs locais nos nós do GKE como uma camada de cache para o armazenamento permanente, como Persistent Disks ou Hyperdisks. O uso de SSDs locais reduz a latência de leitura do disco e aumenta as consultas por segundo (QPS) para cargas de trabalho com estado, minimizando os requisitos de memória. O GKE Data Cache oferece suporte a todos os tipos de Persistent Disk ou Hyperdisk como discos de backup.

Para usar o GKE Data Cache no aplicativo, configure o pool de nós do GKE com SSDs locais anexados. É possível configurar o GKE Data Cache para usar todo ou parte do SSD local anexado. Os SSDs locais usados pela solução GKE Data Cache são criptografados em repouso usando a criptografia padrão Google Cloud .

Benefícios

O GKE Data Cache oferece os seguintes benefícios:

Aumento da taxa de consultas processadas por segundo para bancos de dados convencionais, como MySQL ou Postgres, e bancos de dados vetoriais.
Melhoria da performance de leitura para aplicativos com estado, minimizando a latência do disco.
Hidratação e reidratação de dados mais rápidas porque os SSDs são locais para o nó. Hidratação de dados se refere ao processo inicial de carregamento dos dados necessários do armazenamento permanente para o SSD local. Reidratação de dados se refere ao processo de restauração dos dados nos SSDs locais depois que um nó é reciclado.

Arquitetura de implantação

O diagrama a seguir mostra um exemplo de configuração do GKE Data Cache com dois pods que executam um app. Os pods são executados no mesmo nó do GKE. Cada pod usa um SSD local separado e um disco permanente de backup.

Modos de implantação

É possível configurar o GKE Data Cache em um destes dois modos:

Writethrough (recomendado): quando o aplicativo grava dados, eles são gravados sincronamente no cache e no disco permanente subjacente. O modo writethrough evita a perda de dados e é adequado para a maioria das cargas de trabalho de produção.
Writeback: quando o aplicativo grava dados, eles são gravados apenas no cache. Em seguida, os dados são gravados no disco permanente de forma assíncrona (em segundo plano). O modo writeback melhora a performance de gravação e é adequado para cargas de trabalho que dependem da velocidade. No entanto, esse modo afeta a confiabilidade. Se o nó for desligado inesperadamente, os dados de cache não liberados serão perdidos.

Objetivos

Neste guia, você vai aprender a:

Criar uma infraestrutura do GKE subjacente para usar o GKE Data Cache.
Criar um pool de nós dedicado com SSDs locais anexados.
Criar um StorageClass para provisionar dinamicamente um PersistentVolume (PV) quando um pod o solicita por meio de um PersistentVolumeClaim (PVC).
Criar um PVC para solicitar um PV.
Criar uma implantação que use um PVC para garantir que o seu aplicativo tenha acesso ao armazenamento permanente mesmo após a reinicialização de um pod e durante o reagendamento.

Requisitos e planejamento

Verifique se você atende aos seguintes requisitos para usar o GKE Data Cache:

O cluster do GKE precisa executar a versão 1.32.3-gke.1440000 ou mais recente.
Os pools de nós precisam usar tipos de máquina que ofereçam suporte a SSDs locais. Para mais informações, consulte Suporte a séries de máquinas.

Planejamento

Considere estes aspectos ao planejar a capacidade de armazenamento do GKE Data Cache:

O número máximo de pods por nó que usarão o GKE Data Cache simultaneamente.
Os requisitos de tamanho de cache esperados dos pods que usarão o GKE Data Cache.
A capacidade total de SSDs locais disponíveis nos nós do GKE. Para informações sobre quais tipos de máquinas têm SSDs locais anexados por padrão e quais tipos de máquinas exigem que você anexe SSDs locais, consulte Escolher um número válido de discos SSD locais.
Para tipos de máquinas de terceira geração ou mais recentes (que têm um número padrão de SSDs locais anexados), observe que os SSDs locais para Data Cache são reservados do total disponível de SSDs locais nessa máquina.
A sobrecarga do sistema de arquivos que pode reduzir o espaço utilizável em SSDs locais. Por exemplo, mesmo que você tenha um nó com dois SSDs locais com 750 GiB de capacidade bruta total, o espaço disponível para todos os volumes do Data Cache pode ser menor devido à sobrecarga do sistema de arquivos. Parte da capacidade do SSD local é reservada para uso do sistema.

Limitações

Incompatibilidade com o Backup para GKE

Para manter a integridade de dados em cenários como recuperação de desastres ou migração de aplicativos, talvez seja necessário fazer backup e restaurar os dados. Se você usar Backup para GKE para restaurar um PVC configurado para usar o Data Cache, o processo de restauração falhará. Essa falha ocorre porque o processo de restauração não propaga corretamente os parâmetros de cache de dados necessários do StorageClass original.

Preços

Você recebe cobranças pela capacidade total provisionada dos SSDs locais e dos discos permanentes anexados. A cobrança é feita por GiB mensalmente.

Para mais informações, consulte Preços de disco na documentação do Compute Engine.

Antes de começar

Antes de começar, verifique se você realizou as tarefas a seguir:

Ativar a API Google Kubernetes Engine.

Ativar a API Google Kubernetes Engine

Se você quiser usar a Google Cloud CLI para essa tarefa, instale e, em seguida, inicialize a CLI gcloud. Se você instalou a CLI gcloud anteriormente, instale a versão mais recente executando o comando gcloud components update. Talvez as versões anteriores da CLI gcloud não sejam compatíveis com a execução dos comandos neste documento.
Observação: Para instalações prévias da CLI gcloud, defina a compute/region propriedade. Se você usa principalmente clusters zonais, defina compute/zone. Ao definir um local padrão, é possível evitar erros na CLI gcloud como: One of [--zone, --region] must be supplied: Please specify location. Talvez seja necessário especificar o local em determinados comandos se o local do cluster for diferente do padrão definido.

Analise os tipos de máquina que oferecem suporte a SSDs locais para o pool de nós.

Configurar nós do GKE para usar o Data Cache

Para começar a usar o GKE Data Cache para armazenamento acelerado, os nós precisam ter os recursos de SSD local necessários. Esta seção mostra comandos para provisionar SSDs locais e ativar o GKE Data Cache ao criar um novo cluster do GKE ou adicionar um novo pool de nós a um cluster atual. Não é possível atualizar um pool de nós atual para usar o Data Cache. Se você quiser usar o Data Cache em um cluster atual, adicione um novo pool de nós ao cluster.

Em um novo cluster

Para criar um cluster do GKE com o Data Cache configurado, use o comando a seguir:

gcloud container clusters create CLUSTER_NAME \
    --location=LOCATION \
    --machine-type=MACHINE_TYPE \
    --data-cache-count=DATA_CACHE_COUNT \
    # Optionally specify additional Local SSDs, or skip this flag
    --ephemeral-storage-local-ssd count=LOCAL_SSD_COUNT

Substitua:

CLUSTER_NAME: o nome do cluster. Forneça um nome exclusivo para o cluster do GKE que você está criando.
LOCATION: a Google Cloud região ou zona do novo cluster.
MACHINE_TYPE: o tipo de máquina a ser usado em uma série de máquinas de segunda, terceira ou mais recente para o cluster, como n2-standard-2 ou c3-standard-4-lssd. Esse campo é obrigatório porque o SSD local não pode ser usado com o tipo e2-medium padrão. Para mais informações, consulte as séries de máquinas disponíveis.
DATA_CACHE_COUNT: o número de volumes SSD locais a serem dedicados exclusivamente ao Data Cache em cada nó no pool de nós padrão. Cada um desses SSDs locais tem uma capacidade de 375 GiB. O número máximo de volumes varia de acordo com o tipo de máquina e a região. Observe que parte da capacidade do SSD local é reservada para uso do sistema.
(Opcional) LOCAL_SSD_COUNT: o número de volumes SSD locais a serem provisionados para outras necessidades de armazenamento temporário. Use a flag --ephemeral-storage-local-ssd count se quiser provisionar SSDs locais adicionais que não são usados para o Data Cache.

Observe o seguinte para os tipos de máquinas de terceira geração ou mais recentes:
- Os tipos de máquinas de terceira geração ou mais recentes têm um número específico de SSDs locais anexados por padrão. O número de SSDs locais anexados a cada nó depende do tipo de máquina especificado.
- Se você planeja usar a flag --ephemeral-storage-local-ssd count para armazenamento temporário adicional, defina o valor de DATA_CACHE_COUNT como um número menor que o total disponível de discos SSD locais na máquina. A contagem total de SSDs locais disponíveis inclui os discos anexados padrão e todos os novos discos adicionados usando a flag --ephemeral-storage-local-ssd count.

Esse comando cria um cluster do GKE que é executado em um tipo de máquina de segunda, terceira ou mais recente para o pool de nós padrão, provisiona SSDs locais para o Data Cache e, opcionalmente, provisiona SSDs locais adicionais para outras necessidades de armazenamento temporário, se especificado.

Essas configurações se aplicam apenas ao pool de nós padrão.

Em um cluster atual

Para usar o Data Cache em um cluster atual, é necessário criar um novo pool de nós com o Data Cache configurado.

Para criar um pool de nós do GKE com o Data Cache configurado, use o comando a seguir:

gcloud container node-pool create NODE_POOL_NAME \
    --cluster=CLUSTER_NAME \
    --location=LOCATION \
    --machine-type=MACHINE_TYPE \
    --data-cache-count=DATA_CACHE_COUNT \
    # Optionally specify additional Local SSDs, or skip this flag
    --ephemeral-storage-local-ssd count=LOCAL_SSD_COUNT

Substitua:

NODE_POOL_NAME: o nome do pool de nós. Forneça um nome exclusivo para o pool de nós que você está criando.
CLUSTER_NAME: o nome de um cluster do GKE atual em que você quer criar o pool de nós.
LOCATION: amesma Google Cloud região ou zona do cluster.
MACHINE_TYPE: o tipo de máquina a ser usado em uma série de máquinas de segunda, terceira ou mais recente para o cluster, como n2-standard-2 ou c3-standard-4-lssd. Esse campo é obrigatório, já que o SSD local não pode ser usado com o tipo e2-medium padrão. Para mais informações, consulte as séries de máquinas disponíveis.
DATA_CACHE_COUNT: o número de volumes SSD locais a serem dedicados exclusivamente ao Data Cache em cada nó no pool de nós. Cada um desses SSDs locais tem uma capacidade de 375 GiB. O número máximo de volumes varia de acordo com o tipo de máquina e a região. Observe que parte da capacidade do SSD local é reservada para uso do sistema.
(Opcional) LOCAL_SSD_COUNT: o número de volumes SSD locais a serem provisionados para outras necessidades de armazenamento temporário. Use a flag --ephemeral-storage-local-ssd count se quiser provisionar SSDs locais adicionais que não são usados para o Data Cache.

Observe o seguinte para os tipos de máquinas de terceira geração ou mais recentes:
- Os tipos de máquinas de terceira geração ou mais recentes têm um número específico de SSDs locais anexados por padrão. O número de SSDs locais anexados a cada nó depende do tipo de máquina especificado.
- Se você planeja usar a flag --ephemeral-storage-local-ssd count para armazenamento temporário adicional, defina o DATA_CACHE_COUNT como menor que o total disponível de discos SSD locais na máquina. A contagem total de SSDs locais disponíveis inclui os discos anexados padrão e todos os novos discos adicionados usando a flag --ephemeral-storage-local-ssd count.

Esse comando cria um pool de nós do GKE que é executado em um tipo de máquina de segunda, terceira ou mais recente, provisiona SSDs locais para o Data Cache e, opcionalmente, provisiona SSDs locais adicionais para outras necessidades de armazenamento temporário, se especificado.

Provisionar o Data Cache para armazenamento permanente no GKE

Esta seção fornece um exemplo de como ativar os benefícios de performance do GKE Data Cache para aplicativos com estado.

Criar um pool de nós com SSDs locais para o Data Cache

Comece criando um novo pool de nós com SSDs locais anexados no cluster do GKE. O GKE Data Cache usa os SSDs locais para acelerar a performance dos discos permanentes anexados.

O comando a seguir cria um pool de nós que usa uma máquina de segunda geração, n2-standard-2:

gcloud container node-pools create datacache-node-pool \
    --cluster=CLUSTER_NAME \
    --location=LOCATION \
    --num-nodes=2 \
    --data-cache-count=1 \
    --machine-type=n2-standard-2

Substitua:

CLUSTER_NAME: o nome do cluster. Especifique o cluster do GKE em que você está criando o novo pool de nós.
LOCATION: amesma Google Cloud região ou zona do seu cluster.

Esse comando cria um pool de nós com as seguintes especificações:

--num-nodes=2: define o número inicial de nós nesse pool como dois.
--data-cache-count=1: especifica um SSD local por nó dedicado ao GKE Data Cache.

O número total de SSDs locais provisionados para esse pool de nós é dois, porque cada nó é provisionado com um SSD local.

Criar um StorageClass do Data Cache

Crie um StorageClass do Kubernetes que informe ao GKE como provisionar dinamicamente um volume permanente que usa o Data Cache.

Use o manifesto a seguir para criar e aplicar um StorageClass chamado pd-balanced-data-cache-sc:

kubectl apply -f - <<EOF
apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: pd-balanced-data-cache-sc
provisioner: pd.csi.storage.gke.io
parameters:
  type: pd-balanced
  data-cache-mode: writethrough
  data-cache-size: "100Gi"
volumeBindingMode: WaitForFirstConsumer
allowVolumeExpansion: true
EOF

Os parâmetros StorageClass do Data Cache incluem o seguinte:

type: especifica o tipo de disco subjacente para o volume permanente. Para mais opções, consulte os tipos de Persistent Disk ou Hyperdisk com suporte.
data-cache-mode: usa o modo writethrough recomendado. Para mais informações, consulte Modos de implantação.
data-cache-size: define a capacidade do SSD local como 100 GiB, que é usada como um cache de leitura para cada PVC.

Solicitar armazenamento com um PersistentVolumeClaim (PVC)

Crie um PVC que faça referência ao StorageClass pd-balanced-data-cache-sc criado. O PVC solicita um volume permanente com o Data Cache ativado.

Use o manifesto a seguir para criar um PVC chamado pvc-data-cache que solicita um volume permanente de pelo menos 300 GiB com acesso ReadWriteOnce.

kubectl apply -f - <<EOF
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: pvc-data-cache
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 300Gi
  storageClassName: pd-balanced-data-cache-sc
EOF

Criar uma implantação que use o PVC

Crie uma implantação chamada postgres-data-cache que executa um pod que usa o PVC pvc-data-cache criado anteriormente. O seletor de nós cloud.google.com/gke-data-cache-count garante que o pod seja programado em um nó que tenha os recursos de SSD local necessários para usar o GKE Data Cache.

Crie e aplique o manifesto a seguir para configurar um pod que implanta um servidor da Web do Postgres usando o PVC:

kubectl apply -f - <<EOF
apiVersion: apps/v1
kind: Deployment
metadata:
 name: postgres-data-cache
 labels:
   name: database
   app: data-cache
spec:
 replicas: 1
 selector:
   matchLabels:
     service: postgres
     app: data-cache
 template:
   metadata:
     labels:
       service: postgres
       app: data-cache
   spec:
     nodeSelector:
       cloud.google.com/gke-data-cache-disk: "1"
     containers:
     - name: postgres
       image: postgres:14-alpine
       volumeMounts:
       - name: pvc-data-cache-vol
         mountPath: /var/lib/postgresql/data2
         subPath: postgres
       env:
       - name: POSTGRES_USER
         value: admin
       - name: POSTGRES_PASSWORD
         value: password
     restartPolicy: Always
     volumes:
     - name: pvc-data-cache-vol
       persistentVolumeClaim:
         claimName: pvc-data-cache
EOF

Confirme se a implantação foi criada com sucesso:

kubectl get deployment

Pode levar alguns minutos para que o contêiner do Postgres conclua o provisionamento e mostre um status READY.

Verificar o provisionamento do Data Cache

Depois de criar a implantação, confirme se o armazenamento permanente com o Data Cache está provisionado corretamente.

Para verificar se o pvc-data-cache está vinculado a um volume permanente, execute o comando a seguir:

kubectl get pvc pvc-data-cache

O resultado será assim:

NAME             STATUS   VOLUME                                     CAPACITY   ACCESS MODES   STORAGECLASS                VOLUMEATTRIBUTESCLASS   AGE
pvc-data-cache   Bound    pvc-e9238a16-437e-45d7-ad41-410c400ae018   300Gi      RWO            pd-balanced-data-cache-sc   <unset>                 10m

Para confirmar se o grupo do Logical Volume Manager (LVM) para o Data Cache foi criado no nó, siga estas etapas:

Consiga o nome do pod do driver PDCSI nesse nó:

NODE_NAME=$(kubectl get pod --output json |  jq '.items[0].spec.nodeName' | sed 's/\"//g')
kubectl get po -n kube-system -o wide | grep ^pdcsi-node | grep $NODE_NAME

Na saída, copie o nome do pod pdcsi-node.

Confira os registros do driver PDCSI para a criação do grupo LVM:

PDCSI_POD_NAME="PDCSI-NODE_POD_NAME"
kubectl logs -n kube-system $PDCSI_POD_NAME gce-pd-driver | grep "Volume group creation"

Substitua PDCSI-NODE_POD_NAME pelo nome real do pod copiado na etapa anterior.

O resultado será assim:

Volume group creation succeeded for LVM_GROUP_NAME

Essa mensagem confirma que a configuração do LVM para o Data Cache está configurada corretamente no nó.

Limpar

Para evitar cobranças na sua Google Cloud conta, exclua os recursos de armazenamento criados neste guia.

Exclua a implantação.

kubectl delete deployment postgres-data-cache

Exclua o PersistentVolumeClaim.
```
kubectl delete pvc pvc-data-cache
```
Exclua o pool de nós.
```
gcloud container node-pools delete datacache-node-pool \
    --cluster CLUSTER_NAME
```
Substitua CLUSTER_NAME pelo nome do cluster em que você criou o pool de nós que usa o Data Cache.

A seguir

Consulte Solução de problemas de armazenamento no GKE.
Leia mais sobre o driver CSI do Persistent Disk no GitHub.

Acelere o desempenho de leitura de cargas de trabalho com estado usando o cache de dados do GKE Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Sobre o GKE Data Cache

Benefícios

Arquitetura de implantação

Modos de implantação

Objetivos

Requisitos e planejamento

Limitações

Preços

Antes de começar

Configurar nós do GKE para usar o Data Cache

Em um novo cluster

Em um cluster atual

Provisionar o Data Cache para armazenamento permanente no GKE

Criar um pool de nós com SSDs locais para o Data Cache

Criar um StorageClass do Data Cache

Solicitar armazenamento com um PersistentVolumeClaim (PVC)

Criar uma implantação que use o PVC

Verificar o provisionamento do Data Cache

Limpar

A seguir

Acelere o desempenho de leitura de cargas de trabalho com estado usando o cache de dados do GKE