Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Spanner-Spalten-Engine – Übersicht

Auf dieser Seite finden Sie eine Übersicht über die spaltenorientierte Engine für Spanner und eine Beschreibung ihrer Verwendung.

In betrieblichen Datenbanken werden Daten in der Regel extrahiert, transformiert und in ein OLAP-System (Online Analytical Processing) für Analysen geladen. Dieses System ist oft Teil eines Data Warehouse. Mit Data Boost für Spannertrennt Spanner bereits die analytische Berechnung, was die Transaktionsstabilität gewährleistet.

Die spaltenbasierte Engine ist eine Speichertechnik, mit der Analysesysteme Scans im Vergleich zu batchbasierten Scans beschleunigen. Mit der spaltenorientierten Engine von Spanner können Sie Analysen mit deutlich verbesserter Leistung für die neuesten Betriebsdaten ausführen. Die spaltenorientierte Engine von Spanner steigert die Scanleistung um das bis zu 200-Fache. ETL-Vorgänge sind nicht mehr erforderlich und die strikte Konsistenz bleibt erhalten.

Das Ressi-Format von Spanner verwendet ein spaltenweises Layout mit Partition Attributes Across (PAX) für effiziente Scans innerhalb eines Datenblocks. Bei diesem Format werden jedoch alle Spalten einer Zeile in einem bestimmten Block zusammengefasst, um schnelle Suchen nach einzelnen Zeilen zu ermöglichen. Im Gegensatz zu Ressi werden bei der spaltenorientierten Engine von Spanner Blockläufe einer einzelnen Spalte zugewiesen. Dieser Ansatz ist für sequenzielle Scans effizienter, da Spanner nur die Spalten lesen muss, auf die in der Abfrage verwiesen wird.

Spanner erstellt die spaltenorientierte Darstellung im Hintergrund (im Rahmen von Komprimierungen) und führt sie zur Abfragezeit automatisch mit den neuesten Aktualisierungen zusammen, um eine strikte Konsistenz zu gewährleisten. Für Abfragen, die nicht von der spaltenorientierten Speicherung profitieren, kann weiterhin PAX verwendet werden.

Zu den Arbeitslasten, die von der Verwendung der spaltenorientierten Engine profitieren, gehören:

Bei der betrieblichen Berichterstellung werden aktuelle Business Intelligence-Daten aus den neuesten Betriebsdaten extrahiert.
Analysen mit Bereitstellung liefern Dashboards und benutzerdefinierte Drill-downs mit interaktiver Latenz.
Bei föderierten Analysen werden Daten aus Spanner und anderen Quellen nahtlos in BigQuery kombiniert.

Spanner-Instanzsicherungen enthalten nicht das spaltenorientierte Format.

Best Practices für die Verwendung der spaltenorientierten Engine

In diesem Abschnitt werden Best Practices für die Verwendung der spaltenorientierten Engine beschrieben.

Optimierung großer Scans

Die spaltenorientierte Engine optimiert Abfragen, bei denen große Datenmengen gescannt werden. Bei kleineren Datenscans oder Abfragen mit schnell erfüllten LIMIT-Klauseln sind zeilenbasierte Scans möglicherweise effizienter.

Wichtige Spalten

Wenn Sie SELECT * verwenden, liest Spanner alle Spalten aus dem spaltenorientierten Speicher. Um die Leistung zu maximieren, geben Sie nur die erforderlichen Spalten an. Beispiel: SELECT column1, column2 FROM ....

Leistungsengpässe identifizieren

Die spaltenorientierte Engine ist für scanlastige Arbeitslasten effektiv. Um eine scanlastige Arbeitslast zu identifizieren, prüfen Sie den Abfrageplan auf eine hohe Latenz im Knoten Table scan (Tabellenscan). Wenn Ihre Abfrage nicht scanlastig ist, priorisieren Sie zuerst andere Optimierungen. Die spaltenorientierte Engine kann später Vorteile bieten, wenn Ihre Optimierungen die Abfrage scanlastig machen.

Optimale spaltenorientierte Abdeckung

Nachdem Sie die spaltenorientierte Engine in einer Datenbank aktiviert haben, die bereits Daten enthält, werden die Daten durch den automatische Komprimierungsprozess von Spanner asynchron im Hintergrund in den spaltenorientierten Speicher konvertiert. Wie stark Ihre Abfrage profitiert, sehen Sie im Abfrageplan am Prozentsatz von Columnar read share (Anteil der spaltenorientierten Lesevorgänge).

Daten mit hoher Fluktuation verwalten

Hohe Schreibraten durch Aktualisierungen oder zufällige Einfügungen können die Leistung der spaltenorientierten Engine beeinträchtigen. Bei Arbeitslasten, bei denen nur angehängt wird, sind die Auswirkungen der Verwendung der spaltenorientierten Engine minimal. Die Komprimierung ist ein Hintergrundprozess, der in der Regel mehrere Tage dauert. Sie kann jedoch schneller erfolgen, wenn die Größe der Datenbank erheblich zunimmt. Alternativ können Sie das Schema so gestalten, dass Schreibvorgänge, bei denen nur angehängt wird, auf der Aufteilungsebene bevorzugt werden. Weitere Informationen finden Sie unter Sharding von nach Zeitstempel sortierten Daten in Spanner.

Arbeitslastisolation

Es gibt zwei Methoden, mit denen Sie analytische Abfragen von Transaktionen isolieren können:

Verwenden Sie gezielte Lesevorgänge, um Lesevorgänge an schreibgeschützte Replikate weiterzuleiten.
Verwenden Sie Data Boost für föderierte Abfragen.

Preise

Die Abrechnung für die spaltenorientierte Engine von Spanner basiert auf der Speichernutzung. Nachdem Sie die spaltenorientierte Engine von Spanner aktiviert haben und die Datenkomprimierung abgeschlossen ist, steigt die Speichernutzung, da die neue spaltenorientierte Darstellung berücksichtigt wird. Die spaltenorientierte Engine bietet Speichermesswerte, mit denen Sie die Auswirkungen auf den Speicher beobachten können. Weitere Informationen finden Sie unter Messwerte für die spaltenorientierte Datenspeicherung.

Die spaltenorientierte Engine von Spanner ist nicht von dem Overhead von 8 Byte pro Zelle betroffen.

Nächste Schritte

Spaltenorientierte Engine aktivieren
Spaltenorientierte Daten abfragen
Spaltenorientierte Engine beobachten