Desplegar Apache Kafka en GKE con Strimzi

Autopilot Standard

En esta guía se muestra cómo usar el operador Strimzi para desplegar clústeres de Apache Kafka.

Kafka es un sistema de mensajería distribuido de código abierto diseñado para gestionar datos de streaming de alto volumen, alto rendimiento y en tiempo real. Te permite crear pipelines de datos de streaming para transferir datos de forma fiable entre diferentes sistemas y aplicaciones, con el fin de admitir tareas de procesamiento y análisis.

Los operadores son extensiones de software que usan recursos personalizados para gestionar aplicaciones y sus componentes. Para obtener más información sobre los motivos para usar operadores, consulta Patrón de operador en la documentación de Kubernetes de código abierto. El operador de Strimzi ofrece flexibilidad en las opciones de implementación y te permite usar taints y tolerancias de Kubernetes para ejecutar Kafka en nodos dedicados.

Esta guía está dirigida a administradores de plataformas, arquitectos de la nube y profesionales de operaciones que quieran desplegar clústeres de Kafka en GKE.

Esta solución es un buen punto de partida si quieres aprender a implementar clústeres de Kafka con un operador de terceros para automatizar la gestión y reducir los errores.

Objetivos

Planificar y desplegar la infraestructura de GKE para Apache Kafka
Implementar y configurar el operador Strimzi
Configurar Apache Kafka con el operador Strimzi

Ventajas

Strimzi ofrece las siguientes ventajas:

Los operadores de Strimzi ofrecen un enfoque simplificado y nativo de Kubernetes para gestionar clústeres de Kafka. Strimzi utiliza recursos personalizados que representan temas y usuarios de Kafka, lo que hace que la gestión de clústeres sea mucho más sencilla y se ajuste a las prácticas recomendadas de Kubernetes.
Strimzi prioriza la seguridad de forma predeterminada generando certificados para los listeners y admitiendo métodos de autenticación seguros, como TLS, SCRAM-SHA y OAuth. Strimzi también gestiona NetworkPolicies para todos los listeners de Kafka.
Strimzi no depende de dependencias externas. Incluye clústeres de Kafka y ZooKeeper con exportadores de métricas integrados, lo que te evita tener que usar herramientas adicionales. También puedes ajustar las configuraciones de los brokers para cumplir requisitos específicos.

Arquitectura de despliegue

Un clúster de Kafka consta de uno o varios servidores, denominados brokers, que colaboran para gestionar los flujos de datos entrantes y facilitar la mensajería de publicación y suscripción para los clientes de Kafka, denominados consumidores.

A cada partición de datos del clúster de Kafka se le asigna un broker líder, que es el responsable de gestionar todas las operaciones de lectura y escritura de esa partición. La partición también puede tener uno o varios brokers seguidores que replican de forma pasiva las acciones del broker líder.

En una configuración típica, ZooKeeper coordina los clústeres de Kafka ayudando a elegir un líder entre los brokers y asegurando una conmutación por error fluida en caso de que surja algún problema.

También puedes desplegar la configuración de Kafka sin Zookeeper activando el modo KRaft, pero la comunidad de Strimzi no considera que este método esté listo para producción porque no incluye compatibilidad con recursos de KafkaTopic, autenticación de credenciales y más.

Disponibilidad y recuperación tras fallos

En este tutorial se usan pools de nodos y zonas independientes para los clústeres de Kafka y ZooKeeper. De esta forma, se garantiza la alta disponibilidad y se prepara la recuperación ante desastres.

Usar varios nodos y zonas es fundamental para conseguir un clúster de Kubernetes de alta disponibilidad en Google Cloud por los siguientes motivos:

Tolerancia a fallos: varios nodos distribuyen la carga de trabajo en todo el clúster, lo que garantiza que, si falla un nodo, los demás puedan asumir las tareas, lo que evita el tiempo de inactividad y las interrupciones del servicio.
Escalabilidad: el uso de varios nodos asegura que el escalado horizontal pueda añadir o eliminar nodos según sea necesario, lo que garantiza una asignación óptima de los recursos y se adapta al aumento del tráfico o de la carga de trabajo.
Alta disponibilidad: usar varias zonas en una región asegura la redundancia y minimiza el riesgo de que haya un único punto de fallo. Si se produce una interrupción en toda una zona de disponibilidad, el clúster puede seguir ejecutándose en otras zonas, lo que permite mantener la disponibilidad del servicio.
Redundancia geográfica: al abarcar nodos en varias regiones, los datos y los servicios del clúster se distribuyen geográficamente, lo que proporciona resistencia frente a desastres naturales, cortes de luz u otras interrupciones locales que puedan afectar a una sola zona.
Actualizaciones y mantenimiento continuos: el uso de varias zonas asegura que las actualizaciones y el mantenimiento continuos se puedan llevar a cabo en nodos individuales sin afectar a la disponibilidad general del clúster. De esta forma, se asegura un servicio continuo y se pueden aplicar las actualizaciones y los parches necesarios sin problemas.
Acuerdos de nivel de servicio (ANS): Google Cloud proporciona ANS para implementaciones multizona, lo que garantiza un nivel mínimo de tiempo de actividad y disponibilidad.

Diagrama de implementación

En el siguiente diagrama se muestra un clúster de Kafka que se ejecuta en varios nodos y zonas de un clúster de GKE:

En el diagrama, Kafka StrimziPodSet se implementa en tres nodos en tres zonas diferentes. Puedes controlar esta configuración definiendo las reglas de afinidad y distribución de la topología del Pod obligatorio en la especificación de recursos personalizados StrimziPodSet.

Si falla una zona, GKE reprograma los pods en nodos nuevos y replica los datos de las réplicas restantes, tanto para Kafka como para Zookeeper, usando la configuración recomendada.

En el siguiente diagrama se muestra un StrimziPodSet de ZooKeeper implementado en tres nodos de tres zonas diferentes:

El recurso personalizado `StrimziPodSet`

En este tutorial se usa el recurso personalizado StrimziPodSet introducido en la versión 0.29 de Strimzi en lugar de StatefulSets.

Los recursos StrimziPodSet ofrecen una mayor escalabilidad para el clúster y te permiten transferir opciones de configuración, lo que te permite hacer cambios más granulares en los pods. El recurso StrimziPodSet está habilitado de forma predeterminada en las versiones 0.35 y posteriores de Strimzi.

Costes

En este documento, se utilizan los siguientes componentes facturables de Google Cloud:

Para generar una estimación de costes basada en el uso previsto, utiliza la calculadora de precios.

Los usuarios nuevos pueden disfrutar de una prueba sin coste económico. Google Cloud

Cuando termines las tareas que se describen en este documento, puedes evitar que se te siga facturando eliminando los recursos que has creado. Para obtener más información, consulta la sección Limpiar.

Antes de empezar

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

Install the Google Cloud CLI.

Nota: Si ya has instalado la CLI de gcloud, asegúrate de que tienes la versión más reciente ejecutando gcloud components update.

Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.

Para inicializar gcloud CLI, ejecuta el siguiente comando:

gcloud init

Create or select a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Create a Google Cloud project:
```
gcloud projects create PROJECT_ID
```
Replace PROJECT_ID with a name for the Google Cloud project you are creating.
Select the Google Cloud project that you created:
```
gcloud config set project PROJECT_ID
```
Replace PROJECT_ID with your Google Cloud project name.

Verify that billing is enabled for your Google Cloud project.

Enable the Compute Engine, IAM, GKE, Backup for GKE, and Resource Manager APIs:

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

gcloud services enable compute.googleapis.com iam.googleapis.com container.googleapis.com gkebackup.googleapis.com cloudresourcemanager.googleapis.com

Install the Google Cloud CLI.

Nota: Si ya has instalado la CLI de gcloud, asegúrate de que tienes la versión más reciente ejecutando gcloud components update.

Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.

Para inicializar gcloud CLI, ejecuta el siguiente comando:

gcloud init

Create or select a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Create a Google Cloud project:
```
gcloud projects create PROJECT_ID
```
Replace PROJECT_ID with a name for the Google Cloud project you are creating.
Select the Google Cloud project that you created:
```
gcloud config set project PROJECT_ID
```
Replace PROJECT_ID with your Google Cloud project name.

Verify that billing is enabled for your Google Cloud project.

Enable the Compute Engine, IAM, GKE, Backup for GKE, and Resource Manager APIs:

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

gcloud services enable compute.googleapis.com iam.googleapis.com container.googleapis.com gkebackup.googleapis.com cloudresourcemanager.googleapis.com

Grant roles to your user account. Run the following command once for each of the following IAM roles: roles/storage.objectViewer, roles/logging.logWriter, roles/container.clusterAdmin, roles/container.serviceAgent, roles/iam.serviceAccountAdmin, roles/serviceusage.serviceUsageAdmin, roles/iam.serviceAccountAdmin
```
gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE
```
Replace the following:
- PROJECT_ID: Your project ID.
- USER_IDENTIFIER: The identifier for your user account. For example, myemail@example.com.
- ROLE: The IAM role that you grant to your user account.

Preparar el entorno

En este tutorial, usarás Cloud Shell para gestionar los recursos alojados en Google Cloud. Cloud Shell tiene preinstalado el software que necesitas para este tutorial, como kubectl, la CLI de gcloud, Helm y Terraform.

Para configurar tu entorno con Cloud Shell, sigue estos pasos:

Inicia una sesión de Cloud Shell desde la Google Cloud consola haciendo clic en Activar Cloud Shell en la Google Cloud consola. Se iniciará una sesión en el panel inferior de la consola Google Cloud .

Define las variables de entorno:

export PROJECT_ID=PROJECT_ID
export KUBERNETES_CLUSTER_PREFIX=kafka
export REGION=us-central1

Sustituye PROJECT_ID: your Google Cloud por tu ID de proyecto.

Clona el repositorio de GitHub:

git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples

Cambia al directorio de trabajo:

cd kubernetes-engine-samples/streaming/

Crear la infraestructura del clúster

En esta sección, ejecutarás una secuencia de comandos de Terraform para crear un clúster de GKE regional privado y de alta disponibilidad. Sigue estos pasos para permitir el acceso público al plano de control. Para restringir el acceso, crea un clúster privado.

Puedes instalar el operador con un clúster estándar o Autopilot.

Estándar

En el siguiente diagrama se muestra un clúster de GKE estándar regional privado desplegado en tres zonas diferentes:

Para desplegar esta infraestructura, ejecuta los siguientes comandos desde Cloud Shell:

export GOOGLE_OAUTH_ACCESS_TOKEN=$(gcloud auth print-access-token)
terraform -chdir=kafka/terraform/gke-standard init
terraform -chdir=kafka/terraform/gke-standard apply -var project_id=${PROJECT_ID} \
  -var region=${REGION} \
  -var cluster_prefix=${KUBERNETES_CLUSTER_PREFIX}

Cuando se te solicite, escribe yes. Este comando puede tardar varios minutos en completarse y el clúster en mostrar el estado "Listo".

Terraform crea los siguientes recursos:

Una red de VPC y una subred privada para los nodos de Kubernetes.
Un router para acceder a Internet a través de NAT.
Un clúster de GKE privado en la región us-central1.
2 grupos de nodos con el autoescalado habilitado (de 1 a 2 nodos por zona y 1 nodo por zona como mínimo)
Un ServiceAccount con permisos de registro y monitorización.
Copia de seguridad de GKE para la recuperación tras fallos.
Google Cloud Managed Service para Prometheus para la monitorización de clústeres.

El resultado debería ser similar al siguiente:

...
Apply complete! Resources: 14 added, 0 changed, 0 destroyed.

Outputs:

kubectl_connection_command = "gcloud container clusters get-credentials strimzi-cluster --region us-central1"

Autopilot

En el siguiente diagrama se muestra un clúster de Autopilot de GKE regional privado:

Para desplegar la infraestructura, ejecuta los siguientes comandos desde Cloud Shell:

export GOOGLE_OAUTH_ACCESS_TOKEN=$(gcloud auth print-access-token)
terraform -chdir=kafka/terraform/gke-autopilot init
terraform -chdir=kafka/terraform/gke-autopilot apply -var project_id=${PROJECT_ID} \
  -var region=${REGION} \
  -var cluster_prefix=${KUBERNETES_CLUSTER_PREFIX}

Cuando se te solicite, escribe yes. Este comando puede tardar varios minutos en completarse y el clúster en mostrar el estado "Listo".

Terraform crea los siguientes recursos:

Red de VPC y subred privada para los nodos de Kubernetes.
Un router para acceder a Internet a través de NAT.
Un clúster de GKE privado en la región us-central1.
Un ServiceAccount con permisos de registro y monitorización
Google Cloud Managed Service para Prometheus para la monitorización de clústeres.

El resultado debería ser similar al siguiente:

...
Apply complete! Resources: 12 added, 0 changed, 0 destroyed.

Outputs:

kubectl_connection_command = "gcloud container clusters get-credentials strimzi-cluster --region us-central1"

Conectarse al clúster

Configura kubectl para que se comunique con el clúster:

gcloud container clusters get-credentials ${KUBERNETES_CLUSTER_PREFIX}-cluster --region ${REGION}

Desplegar el operador de Strimzi en el clúster

En esta sección, desplegarás el operador de Strimzi mediante un gráfico de Helm. También hay varias formas de implementar Strimzi.

Añade el repositorio de gráficos de Helm de Strimzi:

helm repo add strimzi https://strimzi.io/charts/

Añade un espacio de nombres para el operador de Strimzi y el clúster de Kafka:
```
kubectl create ns kafka
```
Despliega el operador de clúster de Strimzi con Helm:
```
helm install strimzi-operator strimzi/strimzi-kafka-operator -n kafka
```
Para desplegar el operador de clúster de Strimzi y los clústeres de Kafka en diferentes espacios de nombres, añade el parámetro --set watchNamespaces="{kafka-namespace,kafka-namespace-2,...}" al comando helm.

Verifica que el operador de clúster de Strimzi se ha implementado correctamente con Helm:

helm ls -n kafka

El resultado debería ser similar al siguiente:

NAME            NAMESPACE    REVISION    UPDATED                              STATUS    CHART                        APP VERSION
strimzi-operator    kafka      1       2023-06-27 11:22:15.850545 +0200 CEST    deployed    strimzi-kafka-operator-0.35.0    0.35.0

Desplegar Kafka

Una vez que el operador se haya desplegado en el clúster, podrás desplegar una instancia de clúster de Kafka.

En esta sección, desplegarás Kafka con una configuración básica y, después, probarás varios escenarios de configuración avanzada para abordar los requisitos de disponibilidad, seguridad y observabilidad.

Configuración básica

La configuración básica de la instancia de Kafka incluye los siguientes componentes:

Tres réplicas de brokers de Kafka, con un mínimo de dos réplicas disponibles para mantener la coherencia del clúster.
Tres réplicas de nodos de ZooKeeper que forman un clúster.
Dos listeners de Kafka: uno sin autenticación y otro que utiliza la autenticación TLS con un certificado generado por Strimzi.
MaxHeapSize y MinHeapSize de Java se han definido en 4 GB para Kafka y 2 GB para ZooKeeper.
Asignación de recursos de CPU de 1 solicitud de CPU y 2 límites de CPU tanto para Kafka como para ZooKeeper, junto con 5 GB de solicitudes y límites de memoria para Kafka (4 GB para el servicio principal y 0,5 GB para el exportador de métricas) y 2,5 GB para ZooKeeper (2 GB para el servicio principal y 0,5 GB para el exportador de métricas).
Operador de entidad con las siguientes solicitudes y límites:
- tlsSidecar: 100 m/500 m de CPU y 128 Mi de memoria.
- topicOperator: 100 m/500 m de CPU y 512 Mi de memoria.
- userOperator: 500 m de CPU y 2 Gi de memoria.
Se asignan 100 GB de almacenamiento a cada pod mediante premium-rwo storageClass.
Tolerancias, nodeAffinities y podAntiAffinities configurados para cada carga de trabajo, lo que asegura una distribución adecuada entre los nodos, utilizando sus respectivos grupos de nodos y diferentes zonas.
Comunicación dentro del clúster protegida por certificados autofirmados: autoridades de certificación (CAs) independientes para el clúster y los clientes (mTLS). También puedes configurar el uso de otra autoridad de certificación.

Esta configuración representa la configuración mínima necesaria para crear un clúster de Kafka listo para producción. En las siguientes secciones se muestran configuraciones personalizadas para abordar aspectos como la seguridad de los clústeres, las listas de control de acceso (LCA), la gestión de temas y de certificados, entre otros.

Crear un clúster de Kafka básico

Crea un clúster de Kafka con la configuración básica:
```
kubectl apply -n kafka -f kafka-strimzi/manifests/01-basic-cluster/my-cluster.yaml
```
Este comando crea un recurso personalizado de Kafka del operador Strimzi que incluye solicitudes y límites de CPU y memoria, solicitudes de almacenamiento en bloque y una combinación de taints y afinidades para distribuir los pods aprovisionados entre los nodos de Kubernetes.

Espera unos minutos mientras Kubernetes inicia las cargas de trabajo necesarias:

kubectl wait kafka/my-cluster --for=condition=Ready --timeout=600s -n kafka

Verifica que se hayan creado las cargas de trabajo de Kafka:

kubectl get pod,service,deploy,pdb -l=strimzi.io/cluster=my-cluster -n kafka

El resultado debería ser similar al siguiente:

NAME                                            READY   STATUS  RESTARTS   AGE
pod/my-cluster-entity-operator-848698874f-j5m7f   3/3   Running   0        44m
pod/my-cluster-kafka-0                          1/1   Running   0        5m
pod/my-cluster-kafka-1                          1/1   Running   0        5m
pod/my-cluster-kafka-2                          1/1   Running   0        5m
pod/my-cluster-zookeeper-0                      1/1   Running   0        6m
pod/my-cluster-zookeeper-1                      1/1   Running   0        6m
pod/my-cluster-zookeeper-2                      1/1   Running   0        6m

NAME                                TYPE      CLUSTER-IP   EXTERNAL-IP   PORT(S)                             AGE
service/my-cluster-kafka-bootstrap  ClusterIP   10.52.8.80   <none>      9091/TCP,9092/TCP,9093/TCP          5m
service/my-cluster-kafka-brokers    ClusterIP   None         <none>      9090/TCP,9091/TCP,9092/TCP,9093/TCP   5m
service/my-cluster-zookeeper-client   ClusterIP   10.52.11.144   <none>      2181/TCP                            6m
service/my-cluster-zookeeper-nodes  ClusterIP   None         <none>      2181/TCP,2888/TCP,3888/TCP          6m

NAME                                       READY   UP-TO-DATE   AVAILABLE   AGE
deployment.apps/my-cluster-entity-operator   1/1   1          1         44m

NAME                                            MIN AVAILABLE   MAX UNAVAILABLE   ALLOWED DISRUPTIONS   AGE
poddisruptionbudget.policy/my-cluster-kafka     2             N/A             1                   5m
poddisruptionbudget.policy/my-cluster-zookeeper   2             N/A             1                   6m

El operador crea los siguientes recursos:

Dos StrimziPodSets para Kafka y ZooKeeper.
Tres pods para las réplicas del broker de Kafka.
Tres pods para las réplicas de ZooKeeper.
Dos PodDisruptionBudgets, lo que garantiza una disponibilidad mínima de dos réplicas para la coherencia del clúster.
Un servicio llamado my-cluster-kafka-bootstrap, que actúa como servidor de arranque para los clientes de Kafka que se conectan desde el clúster de Kubernetes. Todos los listeners internos de Kafka están disponibles en este servicio.
Un servicio sin interfaz gráfica llamado my-cluster-kafka-brokers que permite la resolución de DNS de las direcciones IP de los pods de broker de Kafka directamente. Este servicio se usa para la comunicación entre brokers.
Un servicio llamado my-cluster-zookeeper-client que permite que los brokers de Kafka se conecten a los nodos de ZooKeeper como clientes.
Un servicio sin interfaz gráfica llamado my-cluster-zookeeper-nodes que permite la resolución de DNS de las direcciones IP de los pods de ZooKeeper directamente. Este servicio se usa para conectar réplicas de ZooKeeper.
Una implementación llamada my-cluster-entity-operator que contiene los operadores topic-operator y user-operator y facilita la gestión de recursos personalizados KafkaTopics y KafkaUsers.

También puedes configurar dos NetworkPolicies para facilitar la conectividad a los listeners de Kafka desde cualquier pod y espacio de nombres. Estas políticas también restringirían las conexiones a ZooKeeper a los brokers y habilitarían la comunicación entre los pods del clúster y los puertos de servicio internos exclusivos de la comunicación del clúster.

Autenticación y gestión de usuarios

En esta sección se muestra cómo habilitar la autenticación y la autorización para proteger los listeners de Kafka y compartir credenciales con los clientes.

Strimzi proporciona un método nativo de Kubernetes para la gestión de usuarios mediante un User Operator independiente y su recurso personalizado de Kubernetes correspondiente, KafkaUser, que define la configuración del usuario. La configuración de usuario incluye ajustes de autenticación y autorización, y aprovisiona al usuario correspondiente en Kafka.

Strimzi puede crear listeners y usuarios de Kafka que admitan varios mecanismos de autenticación, como la autenticación basada en nombre de usuario y contraseña (SCRAM-SHA-512) o TLS. También puedes usar la autenticación OAuth 2.0, que suele considerarse una opción mejor que usar contraseñas o certificados para la autenticación debido a la seguridad y a la gestión de credenciales externas.

Desplegar un clúster de Kafka

En esta sección se muestra cómo implementar un operador de Strimzi que demuestre las funciones de gestión de usuarios, entre las que se incluyen las siguientes:

Un clúster de Kafka con la autenticación basada en contraseñas (SCRAM-SHA-512) habilitada en uno de los listeners.
KafkaTopic con 3 réplicas.
Un KafkaUser con una LCA que especifica que el usuario tiene permisos de lectura y escritura en el tema.

Configura tu clúster de Kafka para que use un listener con autenticación SCRAM-SHA-512 basada en contraseñas en el puerto 9094 y una autorización sencilla:
```
kubectl apply -n kafka -f kafka-strimzi/manifests/03-auth/my-cluster.yaml
```
Crea un Topic, un User y un pod de cliente para ejecutar comandos en el clúster de Kafka:
```
kubectl apply -n kafka -f kafka-strimzi/manifests/03-auth/topic.yaml
kubectl apply -n kafka -f kafka-strimzi/manifests/03-auth/my-user.yaml
```
El Secret my-user con las credenciales del usuario se monta en el pod del cliente como un volumen.

Estas credenciales confirman que el usuario tiene permisos para publicar mensajes en el tema mediante el listener con la autenticación basada en contraseña (SCRAM-SHA-512) habilitada.

Crea un pod de cliente:

kubectl apply -n kafka -f kafka-strimzi/manifests/03-auth/kafkacat.yaml

Espera unos minutos a que el pod del cliente se convierta en Ready y, a continuación, conéctate a él:

kubectl wait --for=condition=Ready pod --all -n kafka --timeout=600s
kubectl exec -it kafkacat -n kafka -- /bin/sh

Genera un nuevo mensaje con las credenciales de my-user e intenta consumirlo:

echo "Message from my-user" |kcat \
  -b my-cluster-kafka-bootstrap.kafka.svc.cluster.local:9094 \
  -X security.protocol=SASL_SSL \
  -X sasl.mechanisms=SCRAM-SHA-512 \
  -X sasl.username=my-user \
  -X sasl.password=$(cat /my-user/password) \
  -t my-topic -P
kcat -b my-cluster-kafka-bootstrap.kafka.svc.cluster.local:9094 \
  -X security.protocol=SASL_SSL \
  -X sasl.mechanisms=SCRAM-SHA-512 \
  -X sasl.username=my-user \
  -X sasl.password=$(cat /my-user/password) \
  -t my-topic -C

El resultado debería ser similar al siguiente:

Message from my-user
% Reached end of topic my-topic [0] at offset 0
% Reached end of topic my-topic [2] at offset 1
% Reached end of topic my-topic [1] at offset 0

Escribe CTRL+C para detener el proceso del consumidor.

Salir del shell del pod
```
exit
```

Copias de seguridad y recuperación tras desastres

Aunque el operador Strimzi no ofrece una función de copia de seguridad integrada, puedes implementar estrategias de copia de seguridad eficientes siguiendo ciertos patrones.

Puedes usar Copia de seguridad de GKE para crear copias de seguridad de lo siguiente:

Manifiestos de recursos de Kubernetes.
Recursos personalizados de la API de Strimzi y sus definiciones extraídas del servidor de la API de Kubernetes del clúster que se está copiando.
Volúmenes que corresponden a recursos PersistentVolumeClaim encontrados en los manifiestos.

También puedes crear una copia de seguridad de un clúster de Kafka que se haya implementado mediante el operador Strimzi. Deberías crear copias de seguridad de lo siguiente:

La configuración de Kafka, que incluye todos los recursos personalizados de la API de Strimzi, como KafkaTopics y KafkaUsers.
Los datos, que se almacenan en los PersistentVolumes de los brokers de Kafka.

Almacenar los manifiestos de recursos de Kubernetes, incluidas las configuraciones de Strimzi, en repositorios de Git puede eliminar la necesidad de tener una copia de seguridad independiente de la configuración de Kafka, ya que los recursos se pueden volver a aplicar a un nuevo clúster de Kubernetes cuando sea necesario.

Para proteger la recuperación de datos de Kafka en situaciones en las que se pierde una instancia de servidor de Kafka o un clúster de Kubernetes en el que se ha implementado Kafka, le recomendamos que configure la clase de almacenamiento de Kubernetes que se usa para aprovisionar volúmenes para los brokers de Kafka con la opción reclaimPolicy definida como Retain. También te recomendamos que hagas instantáneas de los volúmenes de los brokers de Kafka.

El siguiente archivo de manifiesto describe un StorageClass que usa la opción reclaimPolicy Retain:

apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: premium-rwo-retain
...
reclaimPolicy: Retain
volumeBindingMode: WaitForFirstConsumer

En el siguiente ejemplo se muestra la StorageClass añadida al spec de un recurso personalizado de clúster de Kafka:

# ...
spec:
  kafka:
    # ...
    storage:
      type: persistent-claim
      size: 100Gi
      class: premium-rwo-retain

Con esta configuración, los PersistentVolumes aprovisionados mediante la clase de almacenamiento no se eliminan aunque se elimine el PersistentVolumeClaim correspondiente.

Para recuperar la instancia de Kafka en un nuevo clúster de Kubernetes con la configuración y los datos de la instancia de broker actuales, sigue estos pasos:

Aplicar los recursos personalizados de Kafka de Strimzi (Kakfa, KafkaTopic, KafkaUser, etc.) a un nuevo clúster de Kubernetes
Actualiza los PersistentVolumeClaims con el nombre de las nuevas instancias de broker de Kafka a los PersistentVolumes antiguos mediante la propiedad spec.volumeName en PersistentVolumeClaim.

Limpieza

Para evitar que los recursos utilizados en este tutorial se cobren en tu cuenta de Google Cloud, elimina el proyecto que contiene los recursos o conserva el proyecto y elimina los recursos.

Eliminar el proyecto

Precaución: Eliminar un proyecto tiene los siguientes efectos:

Se elimina todo el contenido del proyecto. Si has usado un proyecto que ya existía para las tareas de este documento, cuando lo elimines, también se eliminará cualquier otro trabajo que hayas realizado en él.
Se pierden los IDs de proyecto personalizados. Cuando creaste este proyecto, es posible que hayas creado un ID de proyecto personalizado que quieras usar en el futuro. Para conservar las URLs que usan el ID del proyecto, como una URL appspot.com, elimina los recursos seleccionados dentro del proyecto en lugar de eliminar todo el proyecto.

Si tienes previsto consultar varias arquitecturas, tutoriales o guías de inicio rápido, reutilizar los proyectos puede ayudarte a no superar los límites de cuota de proyectos.

Delete a Google Cloud project:

gcloud projects delete PROJECT_ID

Eliminar los recursos concretos

Si has usado un proyecto que ya existía y no quieres eliminarlo, elimina los recursos concretos.

Define las variables de entorno.

export PROJECT_ID=${PROJECT_ID}
export KUBERNETES_CLUSTER_PREFIX=kafka
export REGION=us-central1

Ejecuta el comando terraform destroy:

export GOOGLE_OAUTH_ACCESS_TOKEN=$(gcloud auth print-access-token)
terraform -chdir=kafka/terraform/FOLDER destroy -var project_id=${PROJECT_ID}   \
  -var region=${REGION}  \
  -var cluster_prefix=${KUBERNETES_CLUSTER_PREFIX}

Sustituye FOLDER por gke-autopilot o gke-standard.

Cuando se te solicite, escribe yes.

Para encontrar todos los discos sin vincular, haz lo siguiente:
```
export disk_list=$(gcloud compute disks list --filter="-users:* AND labels.name=${KUBERNETES_CLUSTER_PREFIX}-cluster" --format "value[separator=|](name,zone)")
```
Este paso es necesario porque, de forma predeterminada, Strimzi usa el parámetro deleteClaim: false para el almacenamiento. Si eliminas el clúster, todos los discos seguirán disponibles.

Elimina los discos:

for i in $disk_list; do
  disk_name=$(echo $i| cut -d'|' -f1)
  disk_zone=$(echo $i| cut -d'|' -f2|sed 's|.*/||')
  echo "Deleting $disk_name"
  gcloud compute disks delete $disk_name --zone $disk_zone --quiet
done

Siguientes pasos

Consulta arquitecturas de referencia, diagramas y prácticas recomendadas sobre Google Cloud. Consulta nuestro Centro de arquitectura de Cloud.
Consulta cómo crear copias de seguridad de tus clústeres con Copia de seguridad de GKE.

Desplegar Apache Kafka en GKE con Strimzi Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Objetivos

Ventajas

Arquitectura de despliegue

Disponibilidad y recuperación tras fallos

Diagrama de implementación

El recurso personalizado StrimziPodSet

Costes

Antes de empezar

Preparar el entorno

Crear la infraestructura del clúster

Estándar

Autopilot

Conectarse al clúster

Desplegar el operador de Strimzi en el clúster

Desplegar Kafka

Configuración básica

Crear un clúster de Kafka básico

Autenticación y gestión de usuarios

Desplegar un clúster de Kafka

Copias de seguridad y recuperación tras desastres

Limpieza

Eliminar el proyecto

Eliminar los recursos concretos

Siguientes pasos

Desplegar Apache Kafka en GKE con Strimzi

El recurso personalizado `StrimziPodSet`