Ringkasan Managed Service untuk Apache Spark

Managed Service untuk Apache Spark memungkinkan Anda memanfaatkan alat data open source untuk batch processing, pembuatan kueri, streaming, dan machine learning. Otomatisasi Managed Service untuk Apache Spark membantu Anda membuat cluster dengan cepat, mengelolanya dengan mudah, dan menghemat biaya dengan menonaktifkan cluster saat tidak diperlukan. Karena lebih sedikit waktu dan uang yang dihabiskan untuk tugas administrasi, Anda dapat berfokus pada pekerjaan dan data Anda.

Keuntungan Managed Service untuk Apache Spark

Jika dibandingkan dengan produk lokal tradisional dan layanan cloud pesaing, Managed Service untuk Apache Spark memberikan sejumlah keuntungan unik untuk cluster yang terdiri dari tiga hingga ratusan node:

  • Biaya rendah — Managed Service untuk Apache Spark hanya dikenai biaya 1 sen per CPU virtual di cluster Anda per jam, di luar resource Cloud Platform lain yang Anda gunakan. Selain harga yang rendah ini, cluster Managed Service untuk Apache Spark dapat mencakup preemptible instance yang memiliki harga komputasi lebih rendah, sehingga mengurangi biaya Anda lebih lanjut. Daripada membulatkan penggunaan Anda ke jam terdekat, Managed Service untuk Apache Spark hanya menagih Anda untuk apa yang benar-benar Anda gunakan dengan penagihan per detik dan periode penagihan minimum satu menit yang rendah.
  • Sangat cepat — Tanpa menggunakan Managed Service untuk Apache Spark, diperlukan waktu sekitar lima hingga 30 menit untuk membuat cluster Spark dan Hadoop secara lokal atau melalui penyedia IaaS. Sebagai perbandingan, cluster Managed Service untuk Apache Spark dapat dimulai, diskalakan, dan dimatikan dengan cepat. Setiap operasi ini memerlukan waktu rata-rata 90 detik atau kurang. Artinya, Anda dapat menghabiskan lebih sedikit waktu untuk menunggu cluster dan memiliki lebih banyak waktu untuk langsung bekerja dengan data.
  • Terintegrasi — Managed Service untuk Apache Spark memiliki integrasi bawaan dengan layanan lain Google Cloud , seperti BigQuery, Cloud Storage, Bigtable, Cloud Logging, dan Cloud Monitoring, sehingga Anda memiliki lebih dari sekadar cluster Spark atau Hadoop—Anda memiliki platform data lengkap. Misalnya, Anda dapat menggunakan Managed Service untuk Apache Spark untuk melakukan ETL data log mentah berukuran terabyte dengan mudah langsung ke BigQuery untuk pelaporan bisnis.
  • Terkelola — Gunakan cluster Spark dan Hadoop tanpa bantuan administrator atau software khusus. Anda dapat berinteraksi dengan cluster dan tugas Spark atau Hadoop melalui Google Cloud konsol, Cloud SDK, atau Managed Service untuk Apache Spark REST API. Jika sudah selesai menggunakan suatu cluster, Anda dapat menonaktifkannya agar biaya tidak terbuang sia-sia untuk cluster yang tidak ada aktivitas. Anda tidak perlu khawatir kehilangan data, karena Managed Service untuk Apache Spark terintegrasi dengan Cloud Storage, BigQuery, dan Bigtable.
  • Sederhana dan familiar — Anda tidak perlu mempelajari alat atau API baru untuk menggunakan Managed Service untuk Apache Spark, yang memungkinkan Anda memindahkan project yang ada ke Managed Service untuk Apache Spark tanpa pengembangan ulang. Spark, Hadoop, Pig, dan Hive sering diupdate, sehingga Anda dapat lebih cepat produktif.

Apa yang disertakan dalam Managed Service untuk Apache Spark?

Untuk mengetahui daftar versi open source (Hadoop, Spark, Hive, dan Pig) dan Google Cloud konektor yang didukung oleh Managed Service untuk Apache Spark, lihat daftar versi image cluster Managed Service untuk Apache Spark.

Memulai

Untuk memulai, lihat panduan memulai Managed Service untuk Apache Spark. Anda dapat mengakses Managed Service untuk Apache Spark dengan cara berikut: