"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).

Google utilizza la tecnologia AI per tradurre i contenuti nella tua lingua preferita. Le traduzioni generate dall'AI potrebbero contenere errori.

Panoramica di Managed Service for Apache Spark sui cluster

Managed Service for Apache Spark sui cluster ti consente di sfruttare gli strumenti per i dati open source per l'elaborazione batch, l'esecuzione di query, lo streaming e il machine learning. L'automazione di Managed Service for Apache Spark sui cluster ti aiuta a creare i cluster rapidamente, a gestirli con facilità e a risparmiare denaro disattivandoli quando non ti servono. Risparmiando tempo e denaro sull'amministrazione, puoi concentrarti sui tuoi progetti e sui tuoi dati.

Vantaggi di Managed Service for Apache Spark sui cluster

Rispetto ai tradizionali prodotti on-premise e ai servizi cloud concorrenti, Managed Service for Apache Spark offre una serie di vantaggi unici per i cluster da tre a centinaia di nodi:

Costi ridotti: Managed Service for Apache Spark sui cluster ha un prezzo di solo 1 centesimo per CPU virtuale nel cluster all'ora, oltre alle altre risorse Google Cloud che utilizzi. Oltre a questo prezzo basso, i cluster Managed Service for Apache Spark possono includere istanze prerilasciabili che hanno prezzi di calcolo inferiori, riducendo ulteriormente i costi. Anziché arrotondare l'utilizzo all'ora più vicina, Managed Service for Apache Spark sui cluster ti addebita solo ciò che utilizzi realmente con la fatturazione al secondo e un periodo di fatturazione minimo di un minuto.
Super veloce: senza utilizzare Managed Service for Apache Spark sui cluster, la creazione di cluster Spark e Hadoop on-premise o tramite provider IaaS può richiedere dai 5 ai 30 minuti. Al contrario, i cluster Managed Service for Apache Spark sono rapidi da avviare, scalare e arrestare, poiché ciascuna di queste operazioni impiega una media di 90 secondi o meno. Ciò significa che potrai trascorrere meno tempo ad attendere i cluster e più tempo lavorando direttamente sui dati.
Integrato: Managed Service for Apache Spark sui cluster è integrato con altri servizi Google Cloud , come BigQuery, Cloud Storage, Bigtable, Cloud Logging e Cloud Monitoring, in modo da avere a disposizione non solo un cluster Spark o Hadoop, ma una piattaforma di dati completa. Ad esempio, puoi utilizzare Managed Service for Apache Spark sui cluster per eseguire facilmente l'ETL di terabyte di dati di log non elaborati direttamente in BigQuery per la generazione di report aziendali.
Gestito: utilizza i cluster Spark e Hadoop senza l'assistenza di un amministratore o di software speciale. Puoi interagire con cluster e job Spark o Hadoop tramite la console Google Cloud , Cloud SDK o l'API REST Managed Service for Apache Spark sui cluster. Quando hai finito con un cluster, puoi disattivarlo per non spendere soldi per un cluster inattivo. Non dovrai preoccuparti di perdere dati, perché Managed Service for Apache Spark è integrato con Cloud Storage, BigQuery e Bigtable.
Semplice e familiare: non devi imparare a usare nuovi strumenti o API per utilizzare Managed Service for Apache Spark sui cluster, il che ti consente di spostare i progetti esistenti in Managed Service for Apache Spark sui cluster senza doverli rielaborare. Spark, Hadoop, Pig e Hive vengono aggiornati frequentemente, così puoi essere produttivo più rapidamente.

Che cosa è incluso in Managed Service for Apache Spark sui cluster?

Per un elenco delle versioni open source (Hadoop, Spark, Hive e Pig) e dei Google Cloud connettori supportati da Managed Service for Apache Spark sui cluster, consulta gli elenchi delle versioni delle immagini dei cluster Managed Service for Apache Spark.

Per iniziare

Per iniziare, consulta le guide rapide di Managed Service for Apache Spark sui cluster. Puoi accedere a Managed Service for Apache Spark sui cluster nei seguenti modi:

Tramite l'API REST
Utilizzo di Cloud SDK
Utilizzo della Google Cloud console
Utilizzo delle librerie client di Cloud

Panoramica di Managed Service for Apache Spark sui cluster Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Vantaggi di Managed Service for Apache Spark sui cluster

Che cosa è incluso in Managed Service for Apache Spark sui cluster?

Per iniziare

Panoramica di Managed Service for Apache Spark sui cluster