Menggunakan BigQuery Graph dan Spanner Graph
Dokumen ini membantu Anda menentukan solusi grafik yang akan digunakan dengan membandingkan BigQuery Graph dan Spanner Graph.
Perbandingan ini berfungsi sebagai rekomendasi, dan tidak dimaksudkan untuk menjadi mutlak. Ada tumpang-tindih fitur yang signifikan antara BigQuery Graph dan Spanner Graph, dan pengguna harus mengidentifikasi kebutuhan workload mereka sendiri untuk menentukan fitur mana yang akan digunakan.
Kapan menggunakan BigQuery Graph dan Spanner Graph
BigQuery Graph dan Spanner Graph melayani berbagai jenis workload grafik. BigQuery Graph digunakan untuk analisis mendalam dalam skala besar, sedangkan Spanner Graph digunakan untuk operasi real-time.
BigQuery Graph
BigQuery Graph dioptimalkan untuk menjalankan kueri kompleks pada grafik besar. Anda dapat menganalisis pola global, mengidentifikasi tren historis, dan menemukan hubungan tersembunyi dalam set data besar.
Karakteristik teknisnya mencakup performa yang dioptimalkan dalam skala besar, pemrosesan paralel, kueri kompleks pada sebagian besar grafik, komputasi intensif, dan agregasi kompleks.
Kasus penggunaan umum mencakup:
- Deteksi penipuan offline: Temukan pengguna mencurigakan lainnya yang terhubung ke penipu yang dikenal di seluruh jaringan Anda dalam grafik pelanggan, dalam beberapa derajat koneksi yang berbagi email, telepon, atau alamat yang sama. Untuk a tutorial tentang deteksi penipuan, lihat Spanner & BigQuery: Perisai Pertahanan Penipuan Real-Time Perisai.
- Pengoptimalan supply chain: Buat grafik daftar bahan yang mewakili hubungan antara produk akhir dan komponennya untuk perencanaan inventaris. Hitung tanggal pengiriman produk dan pahami ketersediaan bahan dengan menganalisis produk tingkat atas hingga komponen dasarnya di semua lini produk.
- Segmentasi 360 pelanggan: Buat grafik 360 pelanggan untuk memahami perjalanan pelanggan untuk langganan produk, konversi, dan churn. Gunakan grafik ini untuk mengidentifikasi alasan pelanggan churn, mengidentifikasi pola penggunaan, dan menggunakan grafik untuk segmentasi pelanggan dan penargetan audiens di seluruh audiens.
Spanner Graph
Spanner Graph digunakan untuk operasi real-time. Solusi ini dioptimalkan untuk aplikasi yang perlu menjalankan kueri k-hop yang menyentuh sekumpulan kecil elemen grafik secara instan, mendeteksi penipuan dalam milidetik, melakukan pelacakan asal-usul untuk verifikasi identitas dan dependensi, serta menyajikan rekomendasi live.
Karakteristik teknisnya mencakup latensi yang dapat diprediksi dengan jitter minimal, kueri per detik (QPS) yang diskalakan secara linear dengan jumlah node Spanner, dan skala yang hampir tak terbatas. Solusi ini juga dilengkapi penyimpanan grafik bawaan dengan interleaving tabel node dan edge, ketersediaan yang selalu aktif, konsistensi global, serta kueri lookup titik dan multi-hop yang dimulai dari satu node grafik atau sekumpulan node grafik.
Kasus penggunaan umum mencakup:
- Deteksi penipuan real-time: Periksa gesekan kartu kredit terhadap grafik perangkat dan akun penipuan yang dikenal dalam milidetik.
- Operasi jaringan otonom: Buat kembaran digital jaringan Anda untuk pemantauan dan pengoptimalan performa real-time.
- Resolusi entitas: Buat cluster identitas tertaut sebagai sumber kebenaran dari berbagai PII (email, telepon, ID vemo). Gunakan profil kanonis untuk pencarian identitas sebelum menayangkan iklan, melakukan deteksi penipuan real-time, dan melatih penyimpanan fitur.
Cara BigQuery Graph dan Spanner Graph bekerja sama
BigQuery Graph dan Spanner Graph bekerja sama untuk memberikan solusi komprehensif. Misalnya, dalam kasus penggunaan 360 pelanggan:
- Insight real-time: Agen layanan pelanggan menggunakan Spanner Graph untuk menangani keluhan pengguna tentang pengiriman produk yang salah berdasarkan statistik pembelian dan pengiriman real-time.
- Mereplikasi atau membuat kueri: Anda dapat mereplikasi data dari Spanner ke BigQuery menggunakan Spanner Change Streams tanpa ekstrak, transformasi, dan pemuatan (ETL) yang kompleks, atau membuat kueri data Spanner langsung dari BigQuery menggunakan kueri gabungan BigQuery.
- Menganalisis pola: Data scientist menggunakan BigQuery Graph untuk mengidentifikasi "hotspot churn" pada data yang sama untuk memberi label pelanggan sebagai "berisiko".
- Loop masukan: Label "berisiko" didorong ke Spanner Graph dengan dukungan ekstrak, transformasi, dan pemuatan (ETL) terbalik untuk membuat kode kupon bagi pelanggan ini guna mencegah churn.
Memindahkan data antara BigQuery Graph dan Spanner Graph
Anda dapat memindahkan data antara Spanner Graph dan BigQuery Graph agar sesuai dengan persyaratan workload Anda:
ETL penerusan: Untuk memindahkan data dari Spanner ke BigQuery untuk kueri analisis, gunakan template Dataflow.
ETL terbalik: Meskipun Anda dapat membuat kueri data Spanner langsung dari BigQuery Graph, mungkin ada skenario saat Anda perlu memasukkan data BigQuery ke Spanner Graph. Gunakan
EXPORT DATApernyataan SQL. Untuk mengetahui detail selengkapnya, lihat Memahami pipeline ETL terbalik.
Perbandingan fitur
Tabel berikut memberikan perincian fitur yang mendetail berdasarkan produk yang paling dioptimalkan untuk:
| Fitur | BigQuery Graph (offline/batch) | Spanner Graph (online/real-time) |
|---|---|---|
| Model Grafik, Kueri, dan Visualisasi | Pemodelan grafik dan bahasa kueri grafik terpadu, semuanya didukung oleh GoogleSQL, bagian dari standar ISO SQL. Antarmuka yang sama untuk visualisasi grafik. | Pemodelan grafik dan bahasa kueri grafik terpadu, semuanya didukung oleh GoogleSQL, bagian dari standar ISO SQL. Antarmuka yang sama untuk visualisasi grafik. |
| Workload Utama | Offline (batch): agregasi pada set data besar. | Online (real-time): volume tinggi pembacaan/penulisan latensi rendah. |
| Latensi Kueri | Detik hingga jam. Dioptimalkan untuk memindai terabyte/petabyte. | Milidetik hingga detik. Penting untuk aplikasi yang ditampilkan kepada pengguna. |
| Pola kueri | Global atau seluruh grafik: "Siapa yang memiliki 'Jangkauan Jaringan' lebih dari 5.000 orang?" | Lokal atau lingkungan: "Siapa yang berteman dengan teman saya, tetapi tidak berada di lingkaran terdekat saya?" |
| Skala | Skala petabyte, hampir tanpa batas, dioptimalkan untuk data historis skala besar data. | Dapat diskalakan secara horizontal, skala hampir tak terbatas, dioptimalkan untuk data aktif. |
| Keaktualan data | Hampir real-time atau batch. Dapat mengakses data dari berbagai sumber (misalnya, data Spanner Graph menggunakan Data Boost untuk Spanner, Bigtable, Cloud Storage, atau Amazon S3). | Real-time, konsistensi kuat. |
| Input Data | Data lake, log historis, data transaksi yang diarsipkan. | Streaming aplikasi live, interaksi pengguna. |
| Perpindahan Data |
Spanner ke BigQuery (ekstrak,
transformasi, dan pemuatan (ETL) penerusan) dengan template bawaan (batch, streaming).
BigQuery ke Spanner (terbalik
ETL) dengan
EXPORT_DATA.
Gabungan kueri (zero-ETL)
dengan skema eksternal.
|
Spanner ke BigQuery (ekstrak,
transformasi, dan pemuatan (ETL) penerusan) dengan template bawaan (batch, streaming).
BigQuery ke Spanner (terbalik
ETL) dengan
EXPORT_DATA.
Gabungan kueri (zero-ETL)
dengan skema eksternal.
|
Langkah berikutnya
- Pelajari BigQuery Graph lebih lanjut.
- Pelajari Spanner Graph lebih lanjut.