Questa pagina elenca i limiti di quota dell'API Dataproc, che vengono applicati a livello di progetto e di regione. Le quote vengono reimpostate ogni 60 secondi (un minuto).
Per le strategie di ottimizzazione dei cluster che consentono di evitare problemi di quota e disponibilità delle risorse, consulta Disponibilità delle risorse e strategie di zona.
Nella tabella seguente sono elencati i tipi di quote a livello di progetto specifici e predefiniti dell'API Dataproc, i relativi limiti di quota e i metodi a cui vengono applicati.
| Tipo di quota | Limite | Metodi API applicabili |
|---|---|---|
| AutoscalingOperationRequestsPerMinutePerProjectPerRegion | 400 | CreateAutoscalingPolicy, GetAutoscalingPolicy, ListAutoscalingPolicies, UpdateAutoscalingPolicy, DeleteAutoscalingPolicy |
| ClusterOperationRequestsPerMinutePerProjectPerRegion | 200 | CreateCluster, DeleteCluster, UpdateCluster, StopCluster, StartCluster, DiagnoseCluster, RepairCluster |
| NodeGroupOperationRequestsPerMinutePerProjectPerRegion | 600 | CreateNodeGroup, DeleteNodeGroup, ResizeNodeGroup, RepairNodeGroup, UpdateLabelsNodeGroup, StartNodeGroup, StopNodeGroup |
| GetJobRequestsPerMinutePerProjectPerRegion | 7500 | GetJob |
| JobOperationRequestsPerMinutePerProjectPerRegion | 400 | SubmitJob, UpdateJob, CancelJob, DeleteJob |
| WorkflowOperationRequestsPerMinutePerProjectPerRegion | 400 | CreateWorkflowTemplate, InstantiateWorkflowTemplate, InstantiateInlineWorkflowTemplate, UpdateWorkflowTemplate, DeleteWorkflowTemplate |
| DefaultRequestsPerMinutePerProjectPerRegion | 7500 | Tutte le altre operazioni (principalmente operazioni Get) |
La tabella seguente elenca i limiti aggiuntivi per il totale delle operazioni e dei job attivi a livello di progetto e di regione.
| Tipo di quota | Limite | Descrizione |
|---|---|---|
| ActiveOperationsPerProjectPerRegion | 5000 | Limite al numero totale di operazioni attive simultanee di tutti i tipi in un singolo progetto in un singolo database regionale |
| ActiveJobsPerProjectPerRegion | 5000 | Limite al numero totale di job attivi nello stato NON_TERMINAL in un singolo progetto in un singolo database regionale |
Altre Google Cloud quote
I cluster di Dataproc utilizzano altri Google Cloud prodotti. Questi prodotti hanno quote a livello di progetto che includono le quote applicabili all'utilizzo di Dataproc Per l'utilizzo di Dataproc è necessario utilizzare alcuni servizi, richiesti come ad esempio Compute Engine e Cloud Storage. Altri servizi, come BigQuery e Bigtable, possono utilizzare Dataproc in via facoltativa.
Servizi cluster richiesti
I seguenti servizi, che applicano limiti di quota, sono necessari per creare cluster di Dataproc.
Compute Engine
I cluster di Dataproc utilizzano le macchine virtuali di Compute Engine. Le
quote di Compute Engine sono suddivise in limiti globali e a livello di regione. Questi limiti si applicano ai
cluster creati. Ad esempio, la creazione di un cluster con un nodo n1-standard-4 -m e due nodi n1-standard-4 -w utilizza 12 CPU virtuali
(4 * 3). L'utilizzo di questo cluster viene conteggiato nel limite di quota a livello di regione di 24
CPU virtuali.
Risorse dei cluster predefiniti
Quando crei un cluster di Dataproc con impostazioni predefinite, vengono utilizzate le seguenti risorse di Compute Engine.
| Risorsa | Utilizzo |
|---|---|
| CPU virtuali | 12 |
| Istanze di macchine virtuali (VM) | 3 |
| Disco permanente | 1500 GB |
Cloud Logging
Dataproc salva l'output del driver e i log del cluster in Cloud Logging. La quota di Logging si applica ai cluster di Dataproc.
Servizi cluster facoltativi
Puoi utilizzare in via facoltativa i seguenti servizi, che hanno limiti di quota, con i cluster di Dataproc.
BigQuery
Durante la lettura o la scrittura di dati in BigQuery, si applica la quota di BigQuery.
Bigtable
Durante la lettura o la scrittura di dati in Bigtable, si applica la quota di Bigtable.
Disponibilità delle risorse e strategie di zona
Per ottimizzare i cluster per la disponibilità delle risorse e mitigare i potenziali errori di esaurimento delle scorte, valuta le seguenti strategie:
Selezione automatica della zona: quando crei i cluster, utilizza la selezione automatica della zona. In questo modo, Dataproc può selezionare una zona ottimale all'interno della regione specificata, migliorando le probabilità di creazione del cluster.
Quote a livello di regione: verifica che le quote di Compute Engine a livello di regione siano sufficienti poiché le quote possono essere esaurite anche con la selezione automatica della zona se la capacità regionale totale non è sufficiente per le tue richieste.
Flessibilità del tipo di macchina: se riscontri esaurimenti delle scorte persistenti con un tipo di macchina specifico, utilizza un tipo di macchina diverso e più facilmente disponibile per il cluster.