使用 BigQuery 圖表和 Spanner 圖表

本文將比較 BigQuery GraphSpanner Graph,協助您決定要使用哪種圖形解決方案。

這項比較僅供參考,並非絕對值。 BigQuery 圖表和 Spanner Graph 的功能有許多重疊之處,使用者應根據自身工作負載需求,判斷要使用哪項功能。

何時該使用 BigQuery Graph 和 Spanner Graph

BigQuery Graph 和 Spanner Graph 適用於不同類型的圖形工作負載。BigQuery Graph 適用於大規模深入分析,而 Spanner Graph 則適用於即時作業。

BigQuery Graph

BigQuery Graph 經過最佳化調整,能對大型圖表執行複雜查詢。您可以分析全球模式、找出歷史趨勢,並發掘大型資料集中的隱藏關係。

技術特性包括大規模最佳化效能、平行處理、對圖表的重要部分進行複雜查詢、密集運算,以及複雜的匯總。

常見用途包括:

  • 離線詐欺偵測:在客戶圖表的整個網路中,找出與已知詐欺者有關聯的其他可疑使用者,這些使用者在幾度連結內共用相同的電子郵件、電話或地址。如需詐欺偵測教學課程,請參閱「Spanner 和 BigQuery:即時詐欺防禦 Shield」。
  • 最佳化供應鏈:建立物料清單圖,代表最終產品與其組件之間的關係,以利規劃庫存。分析所有產品線的頂層產品及其根元件,計算產品交貨日期並瞭解物料供應情形。
  • 客戶 360 度區隔:建立客戶 360 度圖表,瞭解產品訂閱、轉換和流失的客戶歷程。您可以使用這項功能找出顧客流失的原因、使用模式,並運用圖表將顧客區隔化,以及在整個目標對象中指定目標對象。

Spanner Graph

Spanner Graph 適用於即時作業。這項服務專為需要立即對一小組圖形元素執行 k-hop 查詢、在毫秒內偵測詐欺、執行身分和依附元件驗證的沿襲追蹤,以及提供即時建議的應用程式進行最佳化。

技術特性包括延遲時間可預測且抖動極小、每秒查詢次數 (QPS) 會隨著 Spanner 節點數量線性擴充,以及近乎無限的擴充性。此外,這項服務還內建圖形儲存空間,可交錯處理節點和邊緣資料表、隨時保持可用性、確保全域一致性,並從單一或一組圖形節點開始,執行點查和多跳查詢。

常見用途包括:

  • 即時詐欺偵測:在幾毫秒內,根據已知詐欺裝置和帳戶的圖表,檢查信用卡刷卡交易。
  • 自主網路營運:建構網路的數位孿生,即時監控及最佳化效能。
  • 實體解析:從不同 PII (電子郵件、電話、Vemo ID) 建立連結身分叢集,做為真實來源。在放送廣告前,使用標準設定檔進行身分查詢、執行即時詐欺偵測,以及訓練特徵商店。

BigQuery Graph 和 Spanner Graph 如何搭配運作

BigQuery Graph 和 Spanner Graph 共同提供全方位解決方案。舉例來說,在客戶 360 檢視應用情境中:

  1. 即時洞察:客戶服務專員根據即時購買和運送統計資料,使用 Spanner Graph 處理使用者對運送錯誤產品的申訴。
  2. 複製或查詢:您可以使用 Spanner 變更串流,將資料從 Spanner 複製到 BigQuery,不必進行複雜的擷取、轉換和載入 (ETL) 作業;也可以使用 BigQuery 聯合查詢,直接從 BigQuery 查詢 Spanner 資料。
  3. 分析模式:資料科學家使用 BigQuery 圖表,在相同資料中找出「流失熱點」,並將顧客標示為「有流失風險」。
  4. 意見回饋迴路:「有流失風險」標籤會透過反向擷取、轉換和載入 (ETL) 支援,推送至 Spanner Graph,為這位顧客產生優惠碼,以防顧客流失。

在 BigQuery 圖表和 Spanner Graph 之間移動資料

您可以視工作負載需求,在 Spanner Graph 和 BigQuery 圖表之間移動資料:

  • 正向 ETL:如要將資料從 Spanner 移至 BigQuery 以進行分析查詢,請使用 Dataflow 範本

  • 反向 ETL:雖然您可以直接從 BigQuery Graph 查詢 Spanner 資料,但有時可能需要將 BigQuery 資料匯入 Spanner Graph。使用 EXPORT DATA SQL 陳述式。詳情請參閱「瞭解反向 ETL 管道」。

功能比較

下表詳細列出各項功能最適合的產品:

功能 BigQuery Graph (離線/批次) Spanner Graph (線上/即時)
圖形模型、查詢和視覺化 統一的圖形模型和圖形查詢語言,全都採用 GoogleSQL (ISO SQL 標準的一部分)。圖表視覺化介面相同。 統一的圖形模型和圖形查詢語言,全都採用 GoogleSQL (ISO SQL 標準的一部分)。圖表視覺化介面相同。
主要工作負載 離線 (批次):匯總大量資料集。 線上 (即時):大量低延遲讀取/寫入作業。
查詢延遲 秒數到小時數。已針對掃描 TB/PB 級資料進行最佳化。 毫秒轉換為秒。對於面向使用者的應用程式至關重要。
查詢模式 全域或整個圖表:「誰的『網路觸及人數』超過 5,000 人?」 本地或鄰近地區:「誰是我的朋友的朋友,但不在我的直接圈子內?」
擴充規模 PB 級規模,近乎無限,專為大規模歷史資料而設計。 可水平擴充,規模近乎無限,適合儲存熱門資料。
資料更新間隔 近乎即時或批次。可存取不同來源的資料 (例如使用 Spanner Data Boost 的 Spanner Graph 資料、BigtableCloud StorageAmazon S3)。 即時同步一致性。
輸入資料 資料湖泊、歷史記錄、封存的交易資料。 即時應用程式串流、使用者互動。
資料遷移 使用預先建構的範本 (批次、串流),將 Spanner 資料擷取、轉換及載入 (ETL) 至 BigQuery。透過 EXPORT_DATA,將 BigQuery 資料匯出至 Spanner (反向 ETL)。查詢同盟 (零 ETL),搭配外部結構定義。 使用預先建構的範本 (批次、串流),將 Spanner 資料擷取、轉換及載入 (ETL) 至 BigQuery。透過 EXPORT_DATA,將 BigQuery 資料匯出至 Spanner (反向 ETL)。查詢同盟 (零 ETL),搭配外部結構定義。

後續步驟