La modalità di deployment dei cluster Managed Service per Apache Spark ti consente di sfruttare gli strumenti per i dati open source per elaborazione batch, esecuzione di query, inserimento di flussi e machine learning. L'automazione di Managed Service per Apache Spark ti aiuta a creare i cluster rapidamente, a gestirli con facilità e a risparmiare denaro disattivandoli quando non ti servono. Risparmiando tempo e denaro sull' amministrazione, puoi concentrarti sui tuoi progetti e sui tuoi dati.
Vantaggi della modalità di deployment dei cluster Managed Service per Apache Spark
Rispetto ai tradizionali prodotti on-premise e ai servizi cloud concorrenti, Managed Service per Apache Spark presenta una serie di vantaggi unici per i cluster da tre a centinaia di nodi:
- Costi ridotti : Managed Service per Apache Spark ha un costo di solo 1 centesimo per CPU virtuale nel cluster all'ora, oltre alle altre risorse piattaforma Cloud che utilizzi. Oltre a questo prezzo basso, i cluster Managed Service per Apache Spark possono includere istanze prerilasciabili che hanno prezzi di calcolo inferiori, riducendo ulteriormente i costi. Anziché arrotondare l'utilizzo all'ora più vicina, Managed Service per Apache Spark ti addebita solo ciò che utilizzi realmente con la fatturazione al secondo e un periodo di fatturazione minimo di un minuto.
- Velocità elevata : senza Managed Service per Apache Spark, la creazione di cluster Spark e Hadoop on-premise o tramite provider IaaS può richiedere dai cinque ai 30 minuti. Al contrario, i cluster Managed Service per Apache Spark sono rapidi da avviare, scalare e arrestare, poiché ciascuna di queste operazioni impiega una media di 90 secondi o meno. Ciò significa che potrai trascorrere meno tempo ad attendere i cluster e più tempo lavorando direttamente sui dati.
- Integrato : Managed Service per Apache Spark è integrato con altri servizi Google Cloud Platform, come BigQuery, Cloud Storage, Cloud Bigtable, Cloud Logging e Cloud Monitoring, quindi hai a disposizione più di un semplice cluster Spark o Hadoop: hai una piattaforma dati completa. Ad esempio, puoi utilizzare Managed Service per Apache Spark per eseguire facilmente l'ETL di terabyte di dati di log non elaborati direttamente in BigQuery per la generazione di report aziendali.
- Gestito : utilizza i cluster Spark e Hadoop senza l' assistenza di un amministratore o di software speciale. Puoi interagire facilmente con cluster e job Spark o Hadoop tramite la Google Cloud console, Cloud SDK o l'API REST Managed Service per Apache Spark API. Quando hai finito con un cluster, puoi semplicemente disattivarlo, in modo da non spendere soldi per un cluster inattivo. Non dovrai preoccuparti di perdere i dati, perché Managed Service per Apache Spark è integrato con Cloud Storage, BigQuery e Cloud Bigtable.
- Semplice e familiare : per utilizzare Managed Service per Apache Spark non è necessario imparare a usare nuovi strumenti o API e quindi viene semplificato lo spostamento dei progetti esistenti in Managed Service per Apache Spark senza dover ridefinire lo sviluppo. Spark, Hadoop, Pig e Hive vengono aggiornati frequentemente, perciò puoi essere produttivo più rapidamente.
Che cosa è incluso nella modalità di deployment dei cluster Managed Service per Apache Spark?
Per un elenco delle versioni open source (Hadoop, Spark, Hive e Pig) e Google Cloud dei connettori supportati da Managed Service per Apache Spark, consulta gli elenchi delle versioni delle immagini dei cluster Managed Service per Apache Spark.
Per iniziare
Per iniziare rapidamente, consulta le guide rapide di Managed Service per Apache Spark quickstarts. Puoi accedere alla modalità di deployment dei cluster Managed Service per Apache Spark nei seguenti modi:
- Tramite l'API REST
- Utilizzando il Cloud SDK
- Utilizzando la Google Cloud console
- Tramite le librerie client di Cloud