Mode deployment cluster Managed Service for Apache Spark memungkinkan Anda memanfaatkan alat data open source untuk batch processing, pembuatan kueri, streaming, dan machine learning. Otomatisasi Managed Service for Apache Spark membantu Anda membuat cluster dengan cepat, mengelolanya dengan mudah, dan menghemat uang dengan menonaktifkan cluster saat tidak diperlukan. Karena lebih sedikit waktu dan uang yang dihabiskan untuk tugas administrasi, Anda dapat berfokus pada pekerjaan dan data Anda.
Keunggulan mode deployment cluster Managed Service for Apache Spark
Jika dibandingkan dengan produk tradisional lokal dan layanan cloud pesaing, Managed Service for Apache Spark memiliki sejumlah keunggulan unik untuk cluster yang terdiri dari tiga hingga ratusan node:
- Biaya rendah — Managed Service for Apache Spark hanya dikenai harga 1 sen per CPU virtual di cluster Anda per jam, di luar resource Cloud Platform lain yang Anda gunakan. Selain harga yang rendah ini, cluster Managed Service for Apache Spark dapat mencakup preemptible instance yang memiliki harga komputasi lebih rendah, sehingga mengurangi biaya Anda lebih lanjut. Daripada membulatkan penggunaan Anda ke jam terdekat, Managed Service for Apache Spark hanya menagih Anda untuk apa yang benar-benar Anda gunakan dengan penagihan per detik dan periode penagihan minimum satu menit yang rendah.
- Sangat cepat — Tanpa menggunakan Managed Service for Apache Spark, diperlukan waktu sekitar lima hingga 30 menit untuk membuat cluster Spark dan Hadoop secara lokal atau melalui penyedia IaaS. Sebagai perbandingan, cluster Managed Service for Apache Spark dimulai, diskalakan, dan dimatikan dengan cepat. Setiap operasi ini rata-rata membutuhkan waktu 90 detik atau lebih cepat. Artinya, Anda dapat menghabiskan lebih sedikit waktu menunggu cluster dan memiliki lebih banyak waktu untuk langsung bekerja dengan data.
- Terintegrasi — Managed Service for Apache Spark memiliki integrasi bawaan dengan layanan Google Cloud Platform lainnya, seperti BigQuery, Cloud Storage, Cloud Bigtable, Cloud Logging, dan Cloud Monitoring, sehingga Anda memiliki lebih dari sekadar cluster Spark atau Hadoop—Anda memiliki platform data lengkap. Misalnya, Anda dapat menggunakan Managed Service for Apache Spark untuk dengan mudah melakukan ETL data log mentah berukuran terabyte langsung ke BigQuery untuk pelaporan bisnis.
- Terkelola — Gunakan cluster Spark dan Hadoop tanpa bantuan administrator atau software khusus. Anda dapat dengan mudah berinteraksi dengan cluster dan tugas Spark atau Hadoop melalui Google Cloud konsol, Cloud SDK, atau Managed Service for Apache Spark REST API. Jika sudah selesai menggunakan suatu cluster, Anda dapat menonaktifkannya agar biaya tidak terbuang sia-sia untuk cluster yang tidak ada aktivitas. Anda tidak perlu khawatir kehilangan data, karena Managed Service for Apache Spark terintegrasi dengan Cloud Storage, BigQuery, dan Cloud Bigtable.
- Sederhana dan familiar — Anda tidak perlu mempelajari alat atau API baru untuk menggunakan Managed Service for Apache Spark, sehingga memudahkan Anda memindahkan project yang sudah ada ke Managed Service for Apache Spark tanpa pengembangan ulang. Spark, Hadoop, Pig, dan Hive sering diupdate, sehingga Anda dapat lebih cepat produktif.
Apa yang disertakan dalam mode deployment cluster Managed Service for Apache Spark?
Untuk mengetahui daftar versi open source (Hadoop, Spark, Hive, dan Pig) dan Google Cloud konektor yang didukung oleh Managed Service for Apache Spark, lihat daftar versi image cluster Managed Service for Apache Spark.
Memulai
Untuk memulai dengan cepat, lihat panduan memulai Managed Service for Apache Spark. Anda dapat mengakses mode deployment cluster Managed Service for Apache Spark dengan cara berikut:
- Melalui REST API
- Menggunakan Cloud SDK
- Menggunakan Google Cloud konsol
- Melalui Library Klien Cloud