Utilizzare BigQuery Graph e Spanner Graph

Questo documento ti aiuta a determinare quale soluzione di grafici utilizzare confrontando BigQuery Graph e Spanner Graph.

Questo confronto funge da consiglio e non è inteso come assoluto. Esiste una sovrapposizione significativa delle funzionalità tra BigQuery Graph e Spanner Graph e gli utenti devono identificare le proprie esigenze di carico di lavoro per determinare quale funzionalità utilizzare.

Quando utilizzare BigQuery Graph e Spanner Graph

BigQuery Graph e Spanner Graph gestiscono diversi tipi di carichi di lavoro con grafici. BigQuery Graph è per l'analisi approfondita su larga scala, mentre Spanner Graph è per le operazioni in tempo reale.

BigQuery Graph

BigQuery Graph è ottimizzato per l'esecuzione di query complesse su grafici di grandi dimensioni. Puoi analizzare i pattern globali, identificare le tendenze storiche e scoprire le relazioni nascoste in set di dati di grandi dimensioni.

Le sue caratteristiche tecniche includono prestazioni ottimizzate su larga scala, elaborazione parallela, query complesse su una parte significativa del grafico, calcolo intensivo e aggregazioni complesse.

I casi d'uso comuni includono i seguenti:

  • Rilevamento di attività fraudolente offline: trova altri utenti sospetti collegati a truffatori noti in tutta la rete in un grafico dei clienti, entro pochi gradi di connessioni che condividono la stessa email, lo stesso numero di telefono o lo stesso indirizzo. Per un tutorial sul rilevamento di attività fraudolente, vedi Spanner & BigQuery: scudo di difesa dalle attività fraudolente in tempo reale.
  • Ottimizzazione della catena di fornitura: crea un grafico della distinta base che rappresenti le relazioni tra i prodotti finali e i relativi componenti per la pianificazione dell'inventario. Calcola le date di consegna dei prodotti e comprendi la disponibilità dei materiali analizzando i prodotti di primo livello fino ai componenti principali in tutte le linee di prodotti.
  • Segmentazione dei clienti a 360 gradi: crea un grafico dei clienti a 360 gradi per comprendere i customer journey per abbonamenti ai prodotti, conversioni e abbandono. Utilizza questo grafico per identificare i motivi per cui i clienti abbandonano, identificare i pattern di utilizzo e utilizzarlo per la segmentazione dei clienti e il targeting del pubblico in tutto il pubblico.

Spanner Graph

Spanner Graph è per le operazioni in tempo reale. È ottimizzato per le applicazioni che devono eseguire query k-hop che toccano istantaneamente un piccolo insieme di elementi del grafico, rilevare attività fraudolente in millisecondi, eseguire il tracciamento della derivazione per la verifica dell'identità e delle dipendenze e fornire consigli in tempo reale.

Le sue caratteristiche tecniche includono una latenza prevedibile con un jitter minimo, query al secondo (QPS) che scalano linearmente con il numero di nodi Spanner e una scalabilità praticamente illimitata. Include anche l'archiviazione di grafici integrata con l'interleaving di tabelle di nodi e bordi, disponibilità sempre attiva, coerenza globale e query di ricerca puntuale e multi-hop a partire da un singolo nodo del grafico o da un insieme di nodi del grafico.

I casi d'uso comuni includono i seguenti:

  • Rilevamento di attività fraudolente in tempo reale: controlla uno swipe della carta di credito rispetto a un grafico di dispositivi e account fraudolenti noti in millisecondi.
  • Operazioni di rete autonome: crea un gemello digitale della tua rete per il monitoraggio e l'ottimizzazione delle prestazioni in tempo reale.
  • Risoluzione delle entità: crea cluster di identità collegate come fonte di verità da diverse PII (email, telefono, ID Vemo). Utilizza i profili canonici per la ricerca dell'identità prima di pubblicare gli annunci, esegui il rilevamento di attività fraudolente in tempo reale e addestra gli store di funzionalità.

Come funzionano insieme BigQuery Graph e Spanner Graph

BigQuery Graph e Spanner Graph funzionano insieme per fornire una soluzione completa. Ad esempio, in un caso d'uso dei clienti a 360 gradi:

  1. Insight in tempo reale: un addetto all'assistenza clienti utilizza Spanner Graph per gestire i reclami degli utenti relativi alla spedizione del prodotto errato in base alle statistiche di acquisto e consegna in tempo reale.
  2. Replica o esegui query: puoi replicare i dati da Spanner a BigQuery utilizzando gli stream di modifiche di Spanner senza un'estrazione, una trasformazione e un caricamento (ETL) complessi oppure eseguire query sui dati di Spanner direttamente da BigQuery utilizzando le query federate di BigQuery.
  3. Analizza i pattern: un data scientist utilizza BigQuery Graph per identificare l'"hotspot di abbandono" sugli stessi dati per etichettare il cliente come "a rischio".
  4. Ciclo di feedback: le etichette "a rischio" vengono inviate a Spanner Graph con il supporto ETL inverso per generare un codice coupon per questo cliente per evitare l'abbandono.

Spostare i dati tra BigQuery Graph e Spanner Graph

Puoi spostare i dati tra Spanner Graph e BigQuery Graph in base ai requisiti del carico di lavoro:

  • ETL in avanti: per spostare i dati da Spanner a BigQuery per le query analitiche, utilizza un modello Dataflow.

  • ETL inverso: anche se puoi eseguire query sui dati di Spanner direttamente da BigQuery Graph, potrebbero esistere scenari in cui devi importare i dati di BigQuery in Spanner Graph. Utilizza l'EXPORT DATA istruzione SQL. Per maggiori dettagli, vedi Informazioni sulla pipeline ETL inversa.

Confronto delle funzionalità

La tabella seguente fornisce una suddivisione dettagliata delle funzionalità in base al prodotto per cui sono più ottimizzate:

Funzionalità BigQuery Graph (offline/batch) Spanner Graph (online/in tempo reale)
Modello di grafico, query e visualizzazione Modellazione di grafici e linguaggio di query di grafici unificati, il tutto basato su GoogleSQL, parte dello standard SQL ISO. Stessa interfaccia per la visualizzazione dei grafici. Modellazione di grafici e linguaggio di query di grafici unificati, il tutto basato su GoogleSQL, parte dello standard SQL ISO. Stessa interfaccia per la visualizzazione dei grafici.
Carico di lavoro principale Offline (batch): aggregazioni su set di dati di grandi dimensioni. Online (in tempo reale): volume elevato di letture/scritture a bassa latenza.
Latenza della query Da secondi a ore. Ottimizzato per la scansione di terabyte/petabyte. Da millisecondi a secondi. Fondamentale per le app rivolte agli utenti.
Pattern di query Grafico globale o completo: "Chi ha una 'copertura di rete' di oltre 5000 persone?" Locale o di vicinato: "Chi sono gli amici dei miei amici, ma non fanno parte della mia cerchia ristretta?"
Scala Scala di petabyte, praticamente illimitata, ottimizzata per i dati storici su larga scala. Scalabilità orizzontale, scalabilità praticamente illimitata, ottimizzata per i dati attivi.
Aggiornamento dei dati Quasi in tempo reale o in batch. Può accedere ai dati da origini diverse (ad esempio, dati di Spanner Graph utilizzando Data Boost per Spanner, Bigtable, Cloud Storage, o Amazon S3). In tempo reale, elevata coerenza.
Input di dati Data lake, log storici, dati delle transazioni archiviati. Stream di applicazioni live, interazioni degli utenti.
Spostamento dei dati Da Spanner a BigQuery (ETL in avanti) con modelli predefiniti (batch, streaming). Da BigQuery a Spanner (ETL inverso) con EXPORT_DATA. Federazione di query (senza ETL) con schema esterno. Da Spanner a BigQuery (ETL in avanti) con modelli predefiniti (batch, streaming). Da BigQuery a Spanner (ETL inverso) con EXPORT_DATA. Federazione di query (senza ETL) con schema esterno.

Passaggi successivi