Eine konzeptionelle Übersicht über die spaltenbasierte Engine von AlloyDB finden Sie unter Übersicht über die spaltenbasierte Engine von AlloyDB Omni.
Spaltenbasierte Engine aktivieren
Wenn Sie die spaltenbasierte Engine auf einer Instanz verwenden möchten, legen Sie das
google_columnar_engine.enabled
Flag der Instanz auf on fest.
Einzelserver
So legen Sie google_columnar_engine.enabled auf on fest:
Führen Sie den
ALTER SYSTEMPostgreSQL-Befehl aus:ALTER SYSTEM SET google_columnar_engine.enabled = 'on'Wenn Sie die Konfiguration der spaltenbasierten Engine anpassen möchten, folgen Sie der Anleitung im nächsten Abschnitt, bevor Sie den Datenbankserver neu starten. Andernfalls führen Sie den folgenden Schritt aus, um den Datenbankserver jetzt neu zu starten.
Damit die Änderungen an den Konfigurationsparametern wirksam werden, starten Sie den Container mit AlloyDB Omni neu.
Docker
sudo docker restart CONTAINER_NAMEPodman
sudo podman restart CONTAINER_NAME
Größe des Spaltenspeichers konfigurieren
Wenn die spaltenbasierte Engine auf einer Instanz aktiviert ist, weist AlloyDB Omni einen Teil des Arbeitsspeichers der Instanz zu, um die spaltenbasierten Daten zu speichern. Wenn Sie Ihrem Spaltenspeicher schnellen RAM zuweisen, kann AlloyDB Omni so schnell wie möglich auf die spaltenbasierten Daten zugreifen.
Arbeitsspeicher und Speichercache stellen zusammen die Gesamtkapazität der spaltenbasierten Engine dar.
Arbeitsspeicher konfigurieren
Sie können die Zuweisung mit dem
google_columnar_engine.memory_size_in_mb Flag auf eine feste Größe festlegen.
Einzelserver
So legen Sie das Flag google_columnar_engine.memory_size_in_mb für eine Instanz fest:
Konfigurieren Sie den Arbeitsspeicher, indem Sie den
ALTER SYSTEMPostgreSQL-Befehl ausführen:ALTER SYSTEM SET google_columnar_engine.memory_size_in_mb = COLUMN_MEMORY_SIZE;Ersetzen Sie
COLUMN_MEMORY_SIZEdurch die neue Größe des Spaltenspeichers in Megabyte, z. B.256.Damit die Änderungen an den Konfigurationsparametern wirksam werden, starten Sie den Container mit AlloyDB Omni neu.
Docker
sudo docker restart CONTAINER_NAMEPodman
sudo podman restart CONTAINER_NAME
Speichercache konfigurieren
Einzelserver
Sie können den Speichercache der spaltenbasierten Engine entweder auf dedizierten oder gemeinsam verwendeten Geräten konfigurieren.
Dedizierte Geräte
Auf dedizierten Geräten müssen Sie Laufwerke bereitstellen und ein Dateisystem erstellen, um den Speichercache der spaltenbasierten Engine von AlloyDB Omni für einen Einzelserver-Container zu aktivieren. Anschließend müssen Sie das Cacheverzeichnis in AlloyDB Omni einbinden und schließlich den spaltenbasierten Speichercache aktivieren.
Laufwerke bereitstellen und ein Dateisystem erstellen
Wenn Sie Laufwerke bereitstellen und ein Dateisystem für den Speichercache der spaltenbasierten Engine von AlloyDB Omni erstellen möchten, erstellen Sie ein Dateisystem auf einer oder mehreren Festplatten und stellen es in einem Container mit AlloyDB Omni bereit. Außerdem können Sie Dienstprogramme wie mdadm oder lvm verwenden, um die Kapazität mit mehreren Festplatten zu bündeln und ein beliebiges Dateisystem zu verwenden. Die folgenden Schritte zeigen, wie Sie lvm und ext4 auf einer Ubuntu Compute Engine-Instanz mit NVMe-SSDs verwenden.
Erstellen Sie eine Volume-Gruppe aus allen verfügbaren physischen Geräten:
nvme_prefix="STORAGE_PREFIX" nvme_list=$(ls "$nvme_prefix"*) sudo vgcreate VOLUME_GROUP ${nvme_list}
Ersetzen Sie Folgendes:
STORAGE_PREFIX: Das Präfix des Pfads der lokalen Ziellaufwerke, die über die NVMe-Schnittstelle (Nonvolatile Memory Express) an eine VM angehängt sind. Auf Google Cloudbeginnen die NVMe-Gerätepfade beispielsweise immer mit/dev/nvme0n.VOLUME_GROUP: Der Name einer Volumegruppe, in der Ihre SSDs kombiniert sind, z. B.omni-disk-cache-volume.
-
Verwenden Sie den folgenden Befehl, um ein logisches Volume aus der kostenlosen Kapazität der Volumegruppe aus dem vorherigen Schritt zu erstellen:
sudo lvcreate -n LOGICAL_VOLUME -l 100%FREE VOLUME_GROUP
Ersetzen Sie
LOGICAL_VOLUMEdurch den Namen eines logischen Volumes, das vom LVM als Partition behandelt wird, z. B.omni_disk_cache_device. - Erstellen Sie das
ext4-Dateisystem auf dem logischen Volume. Bei Bedarf können Sie andereext4-Optionen angeben, die der Datensicherheit unterliegen.sudo mkfs.ext4 /dev/VOLUME_GROUP/LOGICAL_VOLUME
Verwenden Sie den folgenden Befehl, um ein Verzeichnis als Bereitstellungspunkt auf dem Hostcomputer zu erstellen und das Dateisystem bereitzustellen:
sudo mkdir /OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY sudo mount /dev/VOLUME_GROUP/LOGICAL_VOLUME /OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY
Ersetzen Sie
OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORYdurch den Namen des Verzeichnisses oder einen Pfad zu dem Verzeichnis, das als Bereitstellungspunkt dient, z. B.omni_columnar_storage_cache_directory.
Spaltenspeicher-Cacheverzeichnis in AlloyDB Omni einbinden
Bevor Sie den Datenträger-Cache für AlloyDB Omni aktivieren, das in einem Container ausgeführt wird, müssen Sie das Cacheverzeichnis in AlloyDB Omni einbinden.
Informationen zur Installation von AlloyDB Omni über ein Docker-Image und zur Anpassung finden Sie unter AlloyDB Omni-Installation anpassen.
Verwenden Sie den folgenden Befehl, um OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY in Ihrem Docker-Container mit AlloyDB Omni bereitzustellen:
Docker
sudo docker run --name CONTAINER_NAME
-e POSTGRES_PASSWORD=PASSWORD
-e PGDATA=/var/lib/postgresql/data/pgdata
-v DATA_DIR:/var/lib/postgresql/data
-v /OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY:/CACHE_DIRECTORY_PATH_INSIDE_CONTAINER
-d google/alloydbomni
Ersetzen Sie Folgendes:
CONTAINER_NAME: Der Name, der dem neuen AlloyDB Omni-Container zugewiesen werden soll, z. B.my-omni.PASSWORD: Das Passwort für den PostgreSQL-Datenbank-Root-Administrator.DATA_DIR: Der Dateisystempfad, den AlloyDB Omni für sein Datenverzeichnis verwenden soll.CACHE_DIRECTORY_PATH_INSIDE_CONTAINER: Das Cacheverzeichnis im AlloyDB Omni-Container, das dem Bereitstellungspunkt auf dem Hostcomputer zugeordnet ist, z. B. basierend auf dem Wert des Cacheverzeichnisses im Container entweder/omni_disk_cache_directory, ähnlich wieOMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY, oder/disk/cache/inside/container.
Podman
podman run --name CONTAINER_NAME
-e POSTGRES_PASSWORD=PASSWORD
-e PGDATA=/var/lib/postgresql/data/pgdata
-v DATA_DIR:/var/lib/postgresql/data
-v /OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY:/CACHE_DIRECTORY_PATH_INSIDE_CONTAINER
-d docker.io/google/alloydbomni
Ersetzen Sie Folgendes:
CONTAINER_NAME: Der Name, der dem neuen AlloyDB Omni-Container zugewiesen werden soll, z. B.my-omni.PASSWORD: Das Passwort für den PostgreSQL-Datenbank-Root-Administrator.CACHE_DIRECTORY_PATH_INSIDE_CONTAINER: Das Cacheverzeichnis im AlloyDB Omni-Container, das dem Bereitstellungspunkt auf dem Hostcomputer zugeordnet ist, z. B. basierend auf dem Wert des Cacheverzeichnisses im Container entweder/omni_columnar_storage_cache_directory, ähnlich wieOMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY, oder/disk/cache/inside/container.
Verwenden Sie die folgenden Befehle, um dem eingebundenen OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY vollständige Zugriffsrechte zu gewähren:
Docker
sudo docker exec -it CONTAINER_NAME chown postgres:postgres /CACHE_DIRECTORY_PATH_INSIDE_CONTAINER sudo docker exec -it CONTAINER_NAME chmod -R a+rw /CACHE_DIRECTORY_PATH_INSIDE_CONTAINER
Podman
sudo podman exec -it CONTAINER_NAME chown postgres:postgres /CACHE_DIRECTORY_PATH_INSIDE_CONTAINER sudo podman exec -it CONTAINER_NAME chmod -R a+rw /CACHE_DIRECTORY_PATH_INSIDE_CONTAINER
Spaltenspeicher-Cache von AlloyDB Omni für AlloyDB Omni aktivieren, das in einem Container ausgeführt wird
Wenn Sie den spaltenbasierten Speichercache von AlloyDB Omni auf dedizierten Geräten für Ihre Datenbank aktivieren möchten, legen Sie die entsprechenden GUC-Parameter (Grand Unified Configuration) fest, nachdem Sie dafür gesorgt haben, dass das eingebundene Cacheverzeichnis aus dem Docker-Container heraus zugänglich ist.
Legen Sie das Verzeichnis für den spaltenbasierten Speichercache fest:
ALTER SYSTEM SET google_columnar_engine.omni_storage_cache_directory = OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY;Ersetzen Sie
OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORYdurch den absoluten Pfad zu dem dedizierten Verzeichnis, in dem AlloyDB Omni die Cachedateien des spaltenbasierten Speichers speichern soll. Prüfen Sie, ob dieses Verzeichnis vorhanden ist und der Datenbanknutzer die entsprechenden Schreibberechtigungen hat.Konfigurieren Sie die Größe des Speichercaches:
ALTER SYSTEM SET google_columnar_engine.storage_cache_size = STORAGE_CACHE_SIZE;Ersetzen Sie
STORAGE_CACHE_SIZEdurch die gewünschte Größe des spaltenbasierten Speichercaches in Megabyte. Standardmäßig wird die gesamte Größe des zweckbestimmten Geräts der spaltenbasierten Engine zugewiesen, ohne den Datenträger-Cache zu beeinträchtigen. Der maximal zulässige Wert für dieses Flag ist das Minimum aus 1000 *google_columnar_engine.memory_size_in_mb.Damit die Änderungen an den Konfigurationsparametern wirksam werden, starten Sie den Container mit AlloyDB Omni neu.
Docker
sudo docker restart CONTAINER_NAMEPodman
sudo podman restart CONTAINER_NAME
Gemeinsam verwendete Geräte
Bevor Sie den spaltenbasierten Speichercache für gemeinsam verwendete Geräte mit Laufwerks-Cache konfigurieren, müssen Sie den Laufwerks-Cache von AlloyDB Omni aktivieren.
Konfigurieren Sie den Speichercache auf gemeinsam verwendeten Geräten so:
Konfigurieren Sie den Speichercache:
ALTER SYSTEM SET google_columnar_engine.storage_cache_size = STORAGE_CACHE_SIZE;Ersetzen Sie
STORAGE_CACHE_SIZEdurch die gewünschte Größe des Speichercaches in Megabyte. Standardmäßig werden 5% des Datenträger-Caches der spaltenbasierten Engine zugewiesen. Der maximal zulässige Wert für dieses Flag ist das Minimum aus 50% des gesamten Datenträger-Caches oder 1000 *google_columnar_engine.memory_size_in_mb.Damit die Änderungen an den Konfigurationsparametern wirksam werden, starten Sie den Container mit AlloyDB Omni neu.
Docker
sudo docker restart CONTAINER_NAMEPodman
sudo podman restart CONTAINER_NAME
Vektorisierte Verknüpfung aktivieren
Die spaltenbasierte Engine verfügt über eine Funktion für vektorisierte Verknüpfungen, mit der die Leistung von Verknüpfungen verbessert werden kann, indem vektorisierte Verarbeitung auf entsprechende Abfragen angewendet wird.
Nachdem Sie die vektorisierte Verknüpfung aktiviert haben, kann der AlloyDB-Abfrageplaner den vektorisierten Verknüpfungsoperator anstelle des Standard-PostgreSQL-Hash-Verknüpfungsoperators anwenden. Der Planer trifft diese Entscheidung, indem er die Kosten für die Ausführung der Abfrage mit jeder Methode vergleicht.
Wenn Sie die vektorisierte Verknüpfung auf einer Instanz aktivieren möchten, legen Sie das
google_columnar_engine.enable_vectorized_join
Flag der Instanz auf on fest.
Führen Sie den ALTER SYSTEM PostgreSQL-Befehl aus, um dieses Flag für eine Instanz festzulegen:
ALTER SYSTEM SET google_columnar_engine.enable_vectorized_join = 'on';
Standardmäßig weist AlloyDB Omni der Funktion für vektorisierte Verknüpfungen einen Thread zu. Sie können die Anzahl der für
diese Funktion verfügbaren Threads erhöhen, indem Sie das
google_columnar_engine.vectorized_join_threads
Flag auf einen größeren Wert festlegen. Der Maximalwert ist cpu_count * 2.
Spaltenbasierte Engine manuell aktualisieren
Wenn die spaltenbasierte Engine aktiviert ist, wird der Spaltenspeicher standardmäßig im Hintergrund aktualisiert.
Führen Sie die folgende SQL-Abfrage aus, um die spaltenbasierte Engine manuell zu aktualisieren:
SELECT google_columnar_engine_refresh(relation =>'TABLE_NAME');
Ersetzen Sie TABLE_NAME durch den Namen der Tabelle oder der materialisierten Ansicht, die Sie manuell aktualisieren möchten.
Spaltenbasierte Engine deaktivieren
Wenn Sie die spaltenbasierte Engine auf einer Instanz deaktivieren möchten, legen Sie das Flag google_columnar_engine.enabled auf off fest.
Einzelserver
So legen Sie google_columnar_engine.enabled auf off fest:
- Führen Sie den
ALTER SYSTEMPostgreSQL-Befehl aus:
ALTER SYSTEM SET google_columnar_engine.enabled = 'off'
- Damit die Änderungen an den Konfigurationsparametern wirksam werden, starten Sie den Container mit AlloyDB Omni neu.
Docker
Führen Sie den docker container restart Befehl aus, um einen AlloyDB Omni-Container neu zu starten:
sudo docker restart CONTAINER_NAMEErsetzen Sie CONTAINER_NAME durch den Namen, den Sie dem AlloyDB Omni-Container bei der Installation zugewiesen haben.
Podman
Führen Sie den podman container start Befehl aus, um einen AlloyDB Omni-Container neu zu starten:
sudo podman restart CONTAINER_NAMEErsetzen Sie CONTAINER_NAME durch den Namen, den Sie dem AlloyDB Omni-Container bei der Installation zugewiesen haben.
Fehlerbehebung bei der spaltenbasierten Engine
Fehler insufficient shared memory beheben
Wenn Sie AlloyDB Omni mit zu wenig gemeinsam genutztem Arbeitsspeicher für die spaltenbasierte Engine ausführen, wird möglicherweise dieser Fehler angezeigt:
Insufficient shared memory for generating the columnar formats.
Sie können dieses Problem beheben, indem Sie die Menge des gemeinsam genutzten Arbeitsspeichers angeben, der dem AlloyDB Omni-Container zur Verfügung steht. Die Vorgehensweise hängt vom Betriebssystem des Hosts ab.
Linux
Erhöhen Sie die Größe der Partition /dev/shm Ihres Hostcomputers, z. B. durch Bearbeiten der Datei /etc/fstab.
macOS
Installieren Sie einen neuen AlloyDB Omni-Container,
und geben Sie einen größeren Wert für den gemeinsam genutzten Arbeitsspeicher für das Flag --shm-size an.
Problem beheben, dass Spalten nicht gefüllt werden
Wenn Spalten in der spaltenbasierten Engine nicht gefüllt werden, kann einer der folgenden Gründe vorliegen:
Die Spalten, die Sie hinzufügen möchten, enthalten einen nicht unterstützten Datentyp.
Die Anforderungen der spaltenbasierten Engine werden nicht erfüllt.
So beheben Sie dieses Problem:
- Bestätigen Sie, dass die Tabellen oder materialisierten Ansichten in der Abfrage in der spaltenbasierten Engine vorhanden sind.
- Prüfen Sie die Verwendung der spaltenbasierten Engine mit der
EXPLAINAnweisung.
Nächste Schritte
Vollständige Liste der Datenbank-Flags für die spaltenbasierte Engine ansehen
Google CodeLab-Tutorial Analytische Abfragen mit der spaltenbasierten Engine in AlloyDB Omni beschleunigen durcharbeiten