Managed Service for Apache Kafka erfasst Messwerte, mit denen Sie Ihre Kafka-Cluster überwachen können. Auf dieser Seite wird beschrieben, wie Sie diese Messwerte in der Google Cloud Console aufrufen.
Sie können die Messwerte auf folgende Arten aufrufen:
Die Seite Clusterdetails enthält Monitoring-Dashboards für Cluster, Themen und Nutzergruppen. Diese Dashboards enthalten vordefinierte Diagramme, mit denen Sie den allgemeinen Zustand und die Leistung Ihres Clusters sehen können.
Mit dem Metrics Explorer können Sie alle verfügbaren Messwerte aufrufen, benutzerdefinierte Diagramme erstellen oder Messwerte aus mehreren Clustern zusammenfassen.
Übersicht
Managed Service for Apache Kafka exportiert mehrere Messwerte, die in der Open-Source-Kafka-Distribution verfügbar sind, sowie dienstspezifische Messwerte wie die Offset-Verzögerung der Nutzergruppe. Für das Monitoring wird der Managed Service for Apache Kafka-Dienst über die Dienst-URL managedkafka.googleapis.com identifiziert.
Die Messwerte sind in vier Ressourcenkategorien unterteilt:
Cluster: Diese Messwerte sind nützlich, um den allgemeinen Zustand von einem Cluster aufrechtzuerhalten.
Thema: Diese Messwerte umfassen Publisher- und Consumer-Raten sowie Fehler. Sie überwachen den allgemeinen Zustand von Kafka-Anwendungen und Probleme, die spezifisch für einen Broker sind.
Themenpartition: Diese Messwerte sind für das Monitoring und die Fehlerbehebung von Leistungsproblemen vorgesehen, die spezifisch für einzelne Partitionen sind, z. B. eine ungleichmäßige Schlüssel verteilung.
Themenpartition-Nutzergruppe: Diese Messwerte überwachen den Zustand von Nutzeranwendungen, hauptsächlich die Verzögerung der Nutzer. Open-Source-Kafka-Fehlermesswerte für Nutzergruppen sind nicht nach Partition verfügbar, sondern nur auf Themenebene.
Einige Messwerte können nach Broker-Index gruppiert werden. Anhand des Broker-Index können Sie die Zone ermitteln, in der dieser Broker bereitgestellt wird. Weitere Informationen finden Sie unter Broker ansehen.
Hinweis
- Melden Sie sich in Ihrem Google Cloud Konto an. Wenn Sie noch kein Google Cloud-Nutzer sind, erstellen Sie ein Konto, um zu sehen, wie sich unsere Produkte in realen Szenarien schlagen. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Managed Kafka API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Managed Kafka API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Erforderliche Rollen und Berechtigungen
Bitten Sie Ihren Administrator, Ihnen die
Managed Kafka Viewer (roles/managedkafka.Viewer)
IAM-Rolle für Ihr Projekt zu erteilen,
um die Berechtigungen zum Aufrufen von Monitoring-Diagrammen zu erhalten.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Weitere Informationen zu dieser Rolle finden Sie unter Vordefinierte Rollen für Managed Service for Apache Kafka.
Monitoring-Dashboards ansehen
So rufen Sie die Monitoring-Dashboards für einen Managed Service for Apache Kafka-Cluster auf:
Rufen Sie in der Google Cloud Console die Seite Cluster auf.
Klicken Sie auf den Namen des Clusters.
Wenn Sie Messwerte für den Cluster aufrufen möchten, wählen Sie den Tab Monitoring aus.
So rufen Sie Messwerte für ein Thema im Cluster auf:
Wählen Sie den Tab Ressourcen aus.
Klicken Sie in der Liste Themen auf den Namen des Themas.
Wählen Sie auf der Seite Themendetails den Tab Monitoring aus.
So rufen Sie Messwerte für eine Nutzergruppe im Cluster auf:
Wählen Sie den Tab Ressourcen aus.
Klicken Sie in der Liste Nutzergruppen auf den Namen der Nutzergruppe.
Wählen Sie auf der Seite Details zur Nutzergruppe den Tab Monitoring aus.
Weitere Informationen finden Sie unter Kafka-Cluster ansehen.
Messwerte in Metrics Explorer aufrufen
So rufen Sie Managed Service for Apache Kafka-Messwerte mit dem Metrics Explorer auf:
Rufen Sie in der Google Cloud Console die Seite Metrics Explorer auf.
Klicken Sie im Bereich Konfiguration auf Messwert auswählen.
Geben Sie im Filter
Apache Kafkaein.Wählen Sie unter Aktive Ressourcen eine der folgenden Optionen aus:
Apache Kafka-Cluster
Apache Kafka-Thema
Apache Kafka-Themenpartition
Apache Kafka-Themenpartition-Nutzergruppe
Wählen Sie einen Messwert aus und klicken Sie auf Anwenden.
Weitere Informationen zum Metrics Explorer finden Sie unter Diagramme mit dem Metrics Explorer erstellen.
Managed Service for Apache Kafka-Messwerte
In den folgenden Tabellen sind häufig verwendete Messwerte für das Monitoring Ihres Kafka-Clusters und Ihrer Clusterressourcen aufgeführt. Die vollständige Liste der verfügbaren Messwerte finden Sie unter Google Cloud Messwerte.
Clustermesswerte
Die folgenden Messwerte gelten für Cluster. Wenn Sie die Messwerte für einen bestimmten Cluster aufrufen möchten, filtern Sie nach dem Label cluster_id.
| Messwert | Beschreibung | Entsprechender MBean-Name |
|---|---|---|
cpu/core_usage_time |
Kumulative CPU-Auslastung des Clusters in vCPUs. Dieser Messwert kann nützlich sein, um die Gesamtbetriebskosten für den Cluster zu ermitteln. | – |
cpu/limit |
Aktuelle Anzahl der für den Cluster konfigurierten CPUs. Kann verwendet werden, um
die CPU-Auslastung als Verhältnis zum Messwert cpu/usage zu überwachen. |
– |
memory/usage |
Aktuelle RAM-Auslastung im Cluster. Kann verwendet werden, um die
RAM-Auslastung als Verhältnis zum memory/limit Messwert zu überwachen. |
– |
memory/limit |
Aktuell konfigurierte RAM-Größe des Clusters. Kann verwendet werden, um die
RAM-Auslastung als Verhältnis zum memory/usage Messwert zu überwachen. |
– |
cluster_byte_in_count |
Die Gesamtzahl der Byte, die von Clients an alle Themen gesendet wurden. | kafka.server:type=BrokerTopicMetrics,name=BytesInPerSec |
cluster_byte_out_count |
Die Gesamtzahl der Byte, die von allen Themen an Clients gesendet wurden. | kafka.server:type=BrokerTopicMetrics,name=BytesOutPerSec |
cluster_message_in_count |
Die Gesamtzahl der Nachrichten, die in allen Themen veröffentlicht wurden. | kafka.server:type=BrokerTopicMetrics,name=MessagesInPerSec |
request_count |
Die Gesamtzahl der Anfragen an den Broker | kafka.network:type=RequestMetrics,name=RequestsPerSec,request=
{Produce|FetchConsumer|FetchFollower},version=([0-9]+) |
request_byte_count |
Die Gesamtgröße der Anfragen an den Cluster in Byte. | kafka.network:type=RequestMetrics,name=RequestBytes,request=
([-.\w]+) |
partitions |
Die aktuelle Anzahl der von diesem Cluster verarbeiteten Partitionen, aufgeschlüsselt nach Broker. | kafka.server:type=ReplicaManager,name=PartitionCount |
request_latencies |
Die Anzahl der Millisekunden für jede Anfrage bei verschiedenen Perzentilen | kafka.network:type=RequestMetrics,name=TotalTimeMs,request=
{Produce|FetchConsumer|FetchFollower} |
consumer_groups |
Die aktuelle Anzahl der Nutzergruppen, die Daten vom Broker abrufen | kafka.server:type=GroupMetadataManager,name=NumGroups |
offline_partitions |
Die Anzahl der Offline-Themenpartitionen, wie vom Controller beobachtet. | kafka.controller:type=KafkaController,name=OfflinePartitionCount |
Themenmesswerte
Die folgenden Messwerte gelten für Themen. Wenn Sie die Messwerte für ein bestimmtes Thema aufrufen möchten, filtern Sie nach den Labels cluster_id und topic_id.
| Messwert | Beschreibung | Entsprechender MBean-Name |
|---|---|---|
message_in_count |
Die Gesamtzahl der Nachrichten, die im Thema veröffentlicht wurden. | kafka.server:type=BrokerTopicMetrics,name=MessagesInPerSec,
topic=([-.\w]+) |
byte_in_count |
Die Gesamtzahl der Byte, die von Clients an das Thema gesendet wurden. | kafka.server:type=BrokerTopicMetrics,name=BytesInPerSec,topic=([-.\w]+) |
topic_request_count |
Die Gesamtzahl der Produktions- und Abrufanfragen an das Thema. | kafka.server:type=BrokerTopicMetrics,name=TotalProduceRequestsPerSec,topic=([-.\w]+)kafka.server:type=BrokerTopicMetrics,name=TotalFetchRequestsPerSec,topic=([-.\w]+) |
topic_error_count |
Die Gesamtzahl der fehlgeschlagenen Produktions- und Abrufanfragen an das Thema. | kafka.server:type=BrokerTopicMetrics,name=FailedProduceRequestsPerSec,topic=([-.\w]+)kafka.server:type=BrokerTopicMetrics,name=FailedFetchRequestsPerSec,topic=([-.\w]+) |
byte_out_count |
Die Gesamtzahl der an Clients gesendeten Byte. | kafka.server:type=BrokerTopicMetrics,name=BytesOutPerSec,
topic=([-.\w]+) |
Partitionsmesswerte
Die folgenden Messwerte gelten für Partitionen. Wenn Sie die Messwerte für eine bestimmte Partition in einem Thema aufrufen möchten, filtern Sie nach den Labels cluster_id, topic_id und partition_index.
| Messwert | Beschreibung | Entsprechender MBean-Name |
|---|---|---|
consumer_lag |
Replikationsverzögerung in Nachrichten zwischen dem Leader und jedem Follower-Replikat. |
kafka.server:type=FetcherLagMetrics,name=ConsumerLag,clientId=([-.\w]+),topic=([-.\w]+),partition=([0-9]+)
|
log_segments |
Die aktuelle Anzahl der Logsegmente. Dieser Messwert ist nützlich, um sicherzustellen, dass die Speicherebenen ordnungsgemäß funktionieren. | kafka.log:type=Log,name=NumLogSegments,topic=([-.\w]+),partition=([0-9]+) |
first_offset |
Der erste Offset für jede Partition im Thema. In Kombination
mit last_offset kann dieser Messwert verwendet werden, um eine Obergrenze für die Gesamtzahl der gespeicherten Nachrichten zu überwachen und den
tatsächlichen Offset der ältesten Nachricht zu ermitteln. |
kafka.log:type=Log,name=LogStartOffset,topic=([-.\w]+),partition=([0-9]+) |
last_offset |
Der letzte Offset in der Partition. Mit diesem Messwert lässt sich der letzte Offset für jede Partition im Zeitverlauf ermitteln. Dieser Messwert kann nützlich sein, um den spezifischen Offset zu ermitteln, der erforderlich ist, um Daten ab einem bestimmten Zeitpunkt in der Vergangenheit neu zu verarbeiten. | kafka.log:type=Log,name=LogEndOffset,topic=([-.\w]+),partition=([0-9]+) |
byte_size |
Die Größe der Partition auf dem Laufwerk in Byte. | – |
Messwerte für Nutzergruppen
Die folgenden Messwerte gelten für Nutzergruppen. Wenn Sie die Messwerte für eine bestimmte Nutzergruppe aufrufen möchten, filtern Sie nach dem Label consumer_group_id.
| Messwert | Beschreibung | Entsprechender MBean-Name |
|---|---|---|
offset_lag |
Die Differenz zwischen dem letzten Offset und dem letzten für die Nutzergruppe für jede Partition bestätigten Offset. Dieser Messwert schätzt, wie viele produzierte Nachrichten der Nutzer noch nicht erfolgreich verarbeitet hat. | – |
Nächste Schritte
Alle Managed Service for Apache Kafka-Messwerte ansehen