BigQuery Graph und Spanner Graph verwenden

In diesem Dokument wird verglichen, welche Graphlösung Sie verwenden sollten, indem BigQuery Graph und Spanner Graph gegenübergestellt werden.

Dieser Vergleich dient als Empfehlung und ist nicht als absolut zu verstehen. BigQuery Graph und Spanner Graph haben viele Funktionen gemeinsam. Nutzer sollten ihre eigenen Anforderungen an die Arbeitslast ermitteln, um zu entscheiden, welche Funktion sie verwenden möchten.

Wann BigQuery Graph und Spanner Graph verwendet werden sollten

BigQuery Graph und Spanner Graph sind für unterschiedliche Arten von Graph-Arbeitslasten vorgesehen. BigQuery Graph ist für detaillierte Analysen im großen Maßstab vorgesehen, während Spanner Graph für Echtzeitvorgänge gedacht ist.

BigQuery-Diagramm

BigQuery Graph ist für die Ausführung komplexer Abfragen in großen Diagrammen optimiert. Sie können globale Muster analysieren, historische Trends erkennen und verborgene Beziehungen in riesigen Datasets aufdecken.

Zu den technischen Merkmalen gehören eine optimierte Leistung bei der Skalierung, die parallele Verarbeitung, komplexe Abfragen für einen erheblichen Teil des Diagramms, intensive Berechnungen und komplexe Aggregationen.

Häufige Anwendungsfälle:

  • Offline-Betrugserkennung:Finden Sie in einem Kundendiagramm andere verdächtige Nutzer, die in Ihrem gesamten Netzwerk mit bekannten Betrügern verbunden sind. Die Verbindungen müssen dabei nur wenige Grade voneinander entfernt sein und dieselbe E-Mail-Adresse, Telefonnummer oder Adresse haben. Ein Tutorial zur Betrugserkennung finden Sie unter Spanner & BigQuery: Real-Time Fraud Defense Shield.
  • Optimierung der Lieferkette:Erstellen Sie ein Diagramm der Stückliste, das die Beziehungen zwischen Endprodukten und ihren Komponenten für die Lagerplanung darstellt. Liefertermine für Produkte berechnen und die Materialverfügbarkeit analysieren, indem Sie Produkte der obersten Ebene bis hin zu ihren grundlegenden Komponenten in allen Produktlinien analysieren.
  • Customer 360-Segmentierung:Erstellen Sie ein Customer 360-Diagramm, um die Kaufprozesse für Produktabos, Conversions und Churn zu analysieren. So können Sie herausfinden, warum Kunden abwandern, Nutzungsmuster erkennen und das Diagramm für die Kundensegmentierung und die Ausrichtung von Zielgruppen für alle Nutzer verwenden.

Spanner Graph

Spanner Graph ist für Echtzeitvorgänge vorgesehen. Sie ist für Anwendungen optimiert, die sofort K-Hop-Abfragen für eine kleine Gruppe von Grafikelementen ausführen, Betrug in Millisekunden erkennen, Lineage-Tracing zur Identitäts- und Abhängigkeitsüberprüfung durchführen und Live-Empfehlungen bereitstellen müssen.

Zu den technischen Merkmalen gehören eine vorhersagbare Latenz mit minimalem Jitter, Abfragen pro Sekunde (QPS), die linear mit der Anzahl der Spanner-Knoten skaliert werden, und eine praktisch unbegrenzte Skalierung. Außerdem bietet sie integrierten Graphenspeicher mit der Möglichkeit, Knoten- und Kantentabellen zu verschachteln, eine permanente Verfügbarkeit, globale Konsistenz sowie Punkt-Lookup- und Multi-Hop-Abfragen, die von einem einzelnen oder mehreren Knoten im Graphen ausgehen.

Häufige Anwendungsfälle:

  • Echtzeit-Betrugserkennung:Ein Kreditkarten-Swipe wird innerhalb von Millisekunden mit einem Diagramm bekannter betrügerischer Geräte und Konten abgeglichen.
  • Autonome Netzwerkfunktionen:Erstellen Sie einen digitalen Zwilling Ihres Netzwerks für die Leistungsüberwachung und ‑optimierung in Echtzeit.
  • Entitätsabgleich:Erstellen Sie Cluster verknüpfter Identitäten als Quelle der Wahrheit aus verschiedenen personenbezogenen Daten (E-Mail-Adresse, Telefonnummer, Vemo-ID). Verwenden Sie die kanonischen Profile für die Identitätssuche, bevor Sie Anzeigen ausliefern, führen Sie die Betrugserkennung in Echtzeit durch und trainieren Sie Feature-Stores.

Zusammenarbeit von BigQuery Graph und Spanner Graph

BigQuery Graph und Spanner Graph arbeiten zusammen, um eine umfassende Lösung zu bieten. Beispiel:

  1. Echtzeitstatistiken:Ein Kundenservicemitarbeiter verwendet Spanner Graph, um Nutzerbeschwerden über den Versand des falschen Produkts zu bearbeiten. Die Grundlage dafür sind Echtzeitstatistiken zu Käufen und Lieferungen.
  2. Replikation oder Abfrage:Sie können Daten aus Spanner in BigQuery replizieren, indem Sie Spanner-Änderungsstreams ohne komplexes Extrahieren, Transformieren und Laden (ETL) verwenden. Alternativ können Sie Spanner-Daten direkt aus BigQuery abfragen, indem Sie föderierte BigQuery-Abfragen verwenden.
  3. Muster analysieren:Ein Data Scientist verwendet BigQuery Graph, um in denselben Daten einen „Churn-Hotspot“ zu identifizieren und den Kunden als „gefährdet“ zu kennzeichnen.
  4. Feedbackschleife:Die Labels „Risiko“ werden mit Reverse-ETL-Unterstützung (Extract, Transform, Load) an Spanner Graph gesendet, um einen Gutscheincode für diesen Kunden zu generieren und so die Abwanderung zu verhindern.

Daten zwischen BigQuery Graph und Spanner Graph verschieben

Sie können Daten zwischen Spanner Graph und BigQuery Graph verschieben, um Ihre Arbeitslastanforderungen zu erfüllen:

  • Forward-ETL:Wenn Sie Daten aus Spanner für Analyseabfragen in BigQuery verschieben möchten, verwenden Sie eine Dataflow-Vorlage.

  • Umgekehrtes ETL:Sie können Spanner-Daten zwar direkt über BigQuery Graph abfragen, es kann aber Szenarien geben, in denen Sie BigQuery-Daten in Spanner Graph importieren müssen. Verwenden Sie die SQL-Anweisung EXPORT DATA. Weitere Informationen finden Sie unter Reverse-ETL-Pipeline verstehen.

Funktionsvergleich

In der folgenden Tabelle finden Sie eine detaillierte Aufschlüsselung der Funktionen nach dem Produkt, für das sie am besten optimiert sind:

Funktion BigQuery Graph (offline/Batch) Spanner Graph (online/Echtzeit)
Graphmodell, Abfrage und Visualisierung Einheitliche Graphmodellierung und Graphabfragesprache, die auf GoogleSQL basiert, einem Teil des ISO-SQL-Standards. Dieselbe Oberfläche für die Visualisierung von Diagrammen. Einheitliche Graphmodellierung und Graphabfragesprache, die auf GoogleSQL basiert, einem Teil des ISO-SQL-Standards. Dieselbe Oberfläche für die Visualisierung von Diagrammen.
Primäre Arbeitslast Offline (Batch): Aggregationen über große Datasets. Online (Echtzeit): hohes Volumen an Lese-/Schreibvorgängen mit niedriger Latenz.
Abfragelatenz Sekunden bis Stunden. Für das Scannen von Terabyte/Petabyte optimiert. Millisekunden bis Sekunden. Wichtig für nutzerorientierte Apps.
Abfragemuster Global oder gesamter Graph: „Wer hat eine ‚Network Reach‘ von mehr als 5.000 Personen?“ Lokal oder Nachbarschaft: „Wer ist mit meinen Freunden befreundet, gehört aber nicht zu meinem unmittelbaren Umfeld?“
Skala Petabyte-Bereich, praktisch unbegrenzt, optimiert für große Mengen an Verlaufsdaten. Horizontal skalierbar, praktisch unbegrenzte Skalierung, für Hot Data optimiert.
Datenaktualität Echtzeitnah oder als Batch. Kann auf Daten aus verschiedenen Quellen zugreifen, z. B. auf Spanner Graph-Daten mit Data Boost für Spanner, Bigtable, Cloud Storage oder Amazon S3. Echtzeit, strikte Konsistenz.
Dateneingabe Data Lakes, historische Logs, archivierte Transaktionsdaten. Live-Anwendungsstreams, Nutzerinteraktionen.
Datenverschiebung Spanner zu BigQuery (Forward-ETL) mit vorgefertigten Vorlagen (Batch, Streaming). BigQuery zu Spanner (Reverse-ETL) mit EXPORT_DATA. Abfrageföderation (Zero-ETL) mit externem Schema. Spanner zu BigQuery (Forward-ETL) mit vorgefertigten Vorlagen (Batch, Streaming). BigQuery zu Spanner (Reverse-ETL) mit EXPORT_DATA. Abfrageföderation (Zero-ETL) mit externem Schema.

Nächste Schritte