Quote di Dataproc

Questa pagina elenca i limiti di quota dell'API Dataproc, che vengono applicati a livello di progetto e di regione. Le quote vengono reimpostate ogni 60 secondi (un minuto).

Per le strategie di ottimizzazione dei cluster che consentono di evitare problemi di quota e disponibilità delle risorse, consulta Disponibilità delle risorse e strategie di zona.

Nella tabella seguente sono elencati i tipi di quote a livello di progetto specifici e predefiniti dell'API Dataproc, i relativi limiti di quota e i metodi a cui vengono applicati.

Tipo di quota Limite Metodi API applicabili
AutoscalingOperationRequestsPerMinutePerProjectPerRegion 400 CreateAutoscalingPolicy, GetAutoscalingPolicy, ListAutoscalingPolicies, UpdateAutoscalingPolicy, DeleteAutoscalingPolicy
ClusterOperationRequestsPerMinutePerProjectPerRegion 200 CreateCluster, DeleteCluster, UpdateCluster, StopCluster, StartCluster, DiagnoseCluster, RepairCluster
NodeGroupOperationRequestsPerMinutePerProjectPerRegion 600 CreateNodeGroup, DeleteNodeGroup, ResizeNodeGroup, RepairNodeGroup, UpdateLabelsNodeGroup, StartNodeGroup, StopNodeGroup
GetJobRequestsPerMinutePerProjectPerRegion 7500 GetJob
JobOperationRequestsPerMinutePerProjectPerRegion 400 SubmitJob, UpdateJob, CancelJob, DeleteJob
WorkflowOperationRequestsPerMinutePerProjectPerRegion 400 CreateWorkflowTemplate, InstantiateWorkflowTemplate, InstantiateInlineWorkflowTemplate, UpdateWorkflowTemplate, DeleteWorkflowTemplate
DefaultRequestsPerMinutePerProjectPerRegion 7500 Tutte le altre operazioni (principalmente operazioni Get)

La tabella seguente elenca i limiti aggiuntivi per il totale delle operazioni e dei job attivi a livello di progetto e di regione.

Tipo di quota Limite Descrizione
ActiveOperationsPerProjectPerRegion 5000 Limite al numero totale di operazioni attive simultanee di tutti i tipi in un singolo progetto in un singolo database regionale
ActiveJobsPerProjectPerRegion 5000 Limite al numero totale di job attivi nello stato NON_TERMINAL in un singolo progetto in un singolo database regionale

Altre Google Cloud quote

I cluster di Dataproc utilizzano altri Google Cloud prodotti. Questi prodotti hanno quote a livello di progetto che includono le quote applicabili all'utilizzo di Dataproc Per l'utilizzo di Dataproc è necessario utilizzare alcuni servizi, richiesti come ad esempio Compute Engine e Cloud Storage. Altri servizi, come BigQuery e Bigtable, possono utilizzare Dataproc in via facoltativa.

Servizi cluster richiesti

I seguenti servizi, che applicano limiti di quota, sono necessari per creare cluster di Dataproc.

Compute Engine

I cluster di Dataproc utilizzano le macchine virtuali di Compute Engine. Le quote di Compute Engine sono suddivise in limiti globali e a livello di regione. Questi limiti si applicano ai cluster creati. Ad esempio, la creazione di un cluster con un nodo n1-standard-4 -m e due nodi n1-standard-4 -w utilizza 12 CPU virtuali (4 * 3). L'utilizzo di questo cluster viene conteggiato nel limite di quota a livello di regione di 24 CPU virtuali.

Risorse dei cluster predefiniti

Quando crei un cluster di Dataproc con impostazioni predefinite, vengono utilizzate le seguenti risorse di Compute Engine.

Risorsa Utilizzo
CPU virtuali 12
Istanze di macchine virtuali (VM) 3
Disco permanente 1500 GB

Cloud Logging

Dataproc salva l'output del driver e i log del cluster in Cloud Logging. La quota di Logging si applica ai cluster di Dataproc.

Servizi cluster facoltativi

Puoi utilizzare in via facoltativa i seguenti servizi, che hanno limiti di quota, con i cluster di Dataproc.

BigQuery

Durante la lettura o la scrittura di dati in BigQuery, si applica la quota di BigQuery.

Bigtable

Durante la lettura o la scrittura di dati in Bigtable, si applica la quota di Bigtable.

Disponibilità delle risorse e strategie di zona

Per ottimizzare i cluster per la disponibilità delle risorse e mitigare i potenziali errori di esaurimento delle scorte, valuta le seguenti strategie:

  • Selezione automatica della zona: quando crei i cluster, utilizza la selezione automatica della zona. In questo modo, Dataproc può selezionare una zona ottimale all'interno della regione specificata, migliorando le probabilità di creazione del cluster.

  • Quote a livello di regione: verifica che le quote di Compute Engine a livello di regione siano sufficienti poiché le quote possono essere esaurite anche con la selezione automatica della zona se la capacità regionale totale non è sufficiente per le tue richieste.

  • Flessibilità del tipo di macchina: se riscontri esaurimenti delle scorte persistenti con un tipo di macchina specifico, utilizza un tipo di macchina diverso e più facilmente disponibile per il cluster.