Metriche Spark

Questo documento fornisce informazioni sulle metriche Spark. Per impostazione predefinita, Serverless per Apache Spark abilita la raccolta delle metriche Spark disponibili, a meno che tu non utilizzi le proprietà di raccolta delle metriche Spark per disabilitare o sostituire la raccolta di una o più metriche Spark.

Per altre proprietà che puoi impostare quando invii un workload batch Spark Serverless per Apache Spark, consulta Proprietà Spark

Proprietà di raccolta delle metriche Spark

Puoi utilizzare le proprietà elencate in questa sezione per disabilitare o sostituire la raccolta di una o più metriche Spark disponibili.

Proprietà Descrizione
spark.dataproc.driver.metrics Utilizza questa proprietà per disabilitare o sostituire le metriche dei driver Spark .
spark.dataproc.executor.metrics Utilizza questa proprietà per disabilitare o sostituire le metriche degli executor Spark.
spark.dataproc.system.metrics Utilizza questa proprietà per disabilitare le metriche di sistema Spark.

Esempi dell'interfaccia a riga di comando gcloud:

  • Disabilita la raccolta delle metriche dei driver Spark:

    gcloud dataproc batches submit spark \
        --properties spark.dataproc.driver.metrics="" \
        --region=region \
        other args ...
    
  • Sostituisci la raccolta delle metriche dei driver predefinita di Spark per raccogliere solo BlockManager:disk.diskSpaceUsed_MB e DAGScheduler:stage.failedStages metriche:

    gcloud dataproc batches submit spark \
        --properties=^~^spark.dataproc.driver.metrics="BlockManager:disk.diskSpaceUsed_MB,DAGScheduler:stage.failedStages" \
        --region=region \
        other args ...
    

Metriche Spark disponibili

Serverless per Apache Spark raccoglie le metriche Spark elencate in questa sezione a meno che tu non utilizzi le proprietà di raccolta delle metriche Spark per disabilitare o sostituire la loro raccolta.

custom.googleapis.com/METRIC_EXPLORER_NAME.

Metriche dei driver Spark

Metrica Nome di Esplora metriche
BlockManager:disk.diskSpaceUsed_MB spark/driver/BlockManager/disk/diskSpaceUsed_MB
BlockManager:memory.maxMem_MB spark/driver/BlockManager/memory/maxMem_MB
BlockManager:memory.memUsed_MB spark/driver/BlockManager/memory/memUsed_MB
DAGScheduler:job.activeJobs spark/driver/DAGScheduler/job/activeJobs
DAGScheduler:job.allJobs spark/driver/DAGScheduler/job/allJobs
DAGScheduler:messageProcessingTime spark/driver/DAGScheduler/messageProcessingTime
DAGScheduler:stage.failedStages spark/driver/DAGScheduler/stage/failedStages
DAGScheduler:stage.runningStages spark/driver/DAGScheduler/stage/runningStages
DAGScheduler:stage.waitingStages spark/driver/DAGScheduler/stage/waitingStages

Metriche degli executor Spark

Metrica Nome di Esplora metriche
ExecutorAllocationManager:executors.numberExecutorsDecommissionUnfinished spark/driver/ExecutorAllocationManager/executors/numberExecutorsDecommissionUnfinished
ExecutorAllocationManager:executors.numberExecutorsExitedUnexpectedly spark/driver/ExecutorAllocationManager/executors/numberExecutorsExitedUnexpectedly
ExecutorAllocationManager:executors.numberExecutorsGracefullyDecommissioned spark/driver/ExecutorAllocationManager/executors/numberExecutorsGracefullyDecommissioned
ExecutorAllocationManager:executors.numberExecutorsKilledByDriver spark/driver/ExecutorAllocationManager/executors/numberExecutorsKilledByDriver
LiveListenerBus:queue.executorManagement.listenerProcessingTime spark/driver/LiveListenerBus/queue/executorManagement/listenerProcessingTime
executor:bytesRead spark/executor/bytesRead
executor:bytesWritten spark/executor/bytesWritten
executor:cpuTime spark/executor/cpuTime
executor:diskBytesSpilled spark/executor/diskBytesSpilled
executor:jvmGCTime spark/executor/jvmGCTime
executor:memoryBytesSpilled spark/executor/memoryBytesSpilled
executor:recordsRead spark/executor/recordsRead
executor:recordsWritten spark/executor/recordsWritten
executor:runTime spark/executor/runTime
executor:shuffleFetchWaitTime spark/executor/shuffleFetchWaitTime
executor:shuffleRecordsRead spark/executor/shuffleRecordsRead
executor:shuffleRecordsWritten spark/executor/shuffleRecordsWritten
executor:shuffleRemoteBytesReadToDisk spark/executor/shuffleRemoteBytesReadToDisk
executor:shuffleWriteTime spark/executor/shuffleWriteTime
executor:succeededTasks spark/executor/succeededTasks
ExecutorMetrics:MajorGCTime spark/executor/ExecutorMetrics/MajorGCTime
ExecutorMetrics:MinorGCTime spark/executor/ExecutorMetrics/MinorGCTime

Metriche di sistema

Metrica Nome di Esplora metriche
agent:uptime agent/uptime
cpu:utilization cpu/utilization
disk:bytes_used disk/bytes_used
disk:percent_used disk/percent_used
memory:bytes_used memory/bytes_used
memory:percent_used memory/percent_used
network:tcp_connections network/tcp_connections

Visualizzare le metriche Spark

Per visualizzare le metriche batch, fai clic su un ID batch nella pagina Dataproc Batch nella Google Cloud console per aprire la pagina Dettagli del batch, che mostra un grafico delle metriche per il workload batch nella scheda Monitoraggio.

Figura 1. Grafico delle metriche Spark per un workload batch.

Per ulteriori informazioni su come visualizzare le metriche raccolte, consulta Dataproc Cloud Monitoring.