"Managed Service for Apache Spark" è il nuovo nome del prodotto precedentemente noto come "Dataproc on Compute Engine" (deployment del cluster) e "Google Cloud Serverless for Apache Spark" (deployment serverless).

Quote di Managed Service per Apache Spark

In questa pagina sono elencati i limiti di quota dell'API Managed Service for Apache Spark, che vengono applicati a livello di progetto e regione. Le quote vengono reimpostate ogni 60 secondi (un minuto).

Per le strategie di ottimizzazione dei cluster che consentono di evitare problemi di quota e disponibilità delle risorse, consulta Disponibilità delle risorse e strategie di zona.

Nella tabella seguente sono elencati i tipi di quote a livello di progetto specifici e predefiniti dell'API Managed Service for Apache Spark, i relativi limiti di quota e i metodi a cui vengono applicati.

Tipo di quota	Limite	Metodi API applicabili
AutoscalingOperationRequestsPerMinutePerProjectPerRegion	400	CreateAutoscalingPolicy, GetAutoscalingPolicy, ListAutoscalingPolicies, UpdateAutoscalingPolicy, DeleteAutoscalingPolicy
ClusterOperationRequestsPerMinutePerProjectPerRegion	200	CreateCluster, DeleteCluster, UpdateCluster, StopCluster, StartCluster, DiagnoseCluster, RepairCluster
NodeGroupOperationRequestsPerMinutePerProjectPerRegion	600	CreateNodeGroup, DeleteNodeGroup, ResizeNodeGroup, RepairNodeGroup, UpdateLabelsNodeGroup, StartNodeGroup, StopNodeGroup
GetJobRequestsPerMinutePerProjectPerRegion	7500	GetJob
JobOperationRequestsPerMinutePerProjectPerRegion	400	SubmitJob, UpdateJob, CancelJob, DeleteJob
WorkflowOperationRequestsPerMinutePerProjectPerRegion	400	CreateWorkflowTemplate, InstantiateWorkflowTemplate, InstantiateInlineWorkflowTemplate, UpdateWorkflowTemplate, DeleteWorkflowTemplate
DefaultRequestsPerMinutePerProjectPerRegion	7500	Tutte le altre operazioni (principalmente operazioni Get)

La tabella seguente elenca limiti aggiuntivi per il totale di operazioni e job attivi a livello di progetto e regione.

Tipo di quota	Limite	Descrizione
ActiveOperationsPerProjectPerRegion	5000	Limite al numero totale di operazioni attive simultanee di tutti i tipi in un singolo progetto in un singolo database regionale
ActiveJobsPerProjectPerRegion	5000	Limite al numero totale di job attivi nello stato `NON_TERMINAL` in un singolo progetto in un singolo database regionale

Altre quote Google Cloud

I cluster Managed Service for Apache Spark utilizzano altri prodotti Google Cloud . Questi prodotti hanno quote a livello di progetto che includono le quote applicabili all'utilizzo di Managed Service for Apache Spark. Per l'utilizzo di Managed Service for Apache Spark è necessario utilizzare alcuni servizi, come ad esempio Compute Engine e Cloud Storage. Altri servizi, come BigQuery e Bigtable, possono utilizzare facoltativamente Managed Service for Apache Spark.

Servizi del cluster richiesti

I seguenti servizi, che applicano limiti di quota, sono necessari per creare cluster Managed Service for Apache Spark.

Compute Engine

I cluster Managed Service for Apache Spark utilizzano le macchine virtuali Compute Engine. Le quote di Compute Engine sono suddivise in limiti globali e a livello di area geografica. Questi limiti si applicano ai cluster che crei. Ad esempio, la creazione di un cluster con un nodo n1-standard-4 -m e due nodi n1-standard-4 -w utilizza 12 CPU virtuali (4 * 3). L'utilizzo di questo cluster viene conteggiato nel limite di quota a livello di regione di 24 CPU virtuali.

Risorse dei cluster predefiniti

Quando crei un cluster Managed Service for Apache Spark con impostazioni predefinite, vengono utilizzate le seguenti risorse di Compute Engine.

Risorsa	Utilizzo
CPU virtuali	12
Istanze di macchine virtuali (VM)	3
Disco permanente	1500 GB

Cloud Logging

Managed Service for Apache Spark salva l'output del driver e i log del cluster in Cloud Logging. La quota di Logging si applica ai cluster Managed Service for Apache Spark.

Servizi del cluster opzionali

Puoi utilizzare facoltativamente i seguenti servizi, che hanno limiti di quota, con i cluster Managed Service for Apache Spark.

BigQuery

Durante la lettura o la scrittura di dati in BigQuery, si applica la quota di BigQuery.

Bigtable

Durante la lettura o la scrittura di dati in Bigtable, si applica la quota di Bigtable.

Disponibilità delle risorse e strategie di zona

Per ottimizzare i cluster in base alla disponibilità delle risorse e ridurre i potenziali errori di esaurimento delle scorte, valuta le seguenti strategie:

Selezione automatica della zona:quando crei cluster, utilizza la selezione automatica della zona. In questo modo, Managed Service for Apache Spark può selezionare una zona ottimale all'interno della regione specificata, aumentando le probabilità di creare correttamente il cluster.
Quote regionali:verifica che le quote di Compute Engine a livello regionale siano sufficienti, poiché le quote possono esaurirsi anche con il posizionamento automatico delle zone se la capacità regionale totale non è sufficiente per le tue richieste.
Flessibilità del tipo di macchina:se riscontri esaurimenti persistenti con un tipo di macchina specifico, utilizza un tipo di macchina diverso e più facilmente disponibile per il tuo cluster.