Spaltenbasierte Engine in AlloyDB Omni konfigurieren

Wählen Sie eine Dokumentationsversion aus:

Auf dieser Seite wird beschrieben, wie Sie die spaltenbasierte Engine in einem AlloyDB Omni-Datenbankcluster aktivieren oder deaktivieren. Außerdem wird erläutert, wie Sie eine geeignete Anfangsgröße für den Spaltenspeicher konfigurieren.

Eine konzeptionelle Übersicht über die spaltenbasierte Engine von AlloyDB finden Sie unter Übersicht über die spaltenbasierte Engine von AlloyDB Omni.

Spaltenbasierte Engine aktivieren

Wenn Sie die spaltenbasierte Engine auf einer Instanz verwenden möchten, legen Sie das google_columnar_engine.enabled Flag der Instanz auf on fest.

Einzelserver

So legen Sie google_columnar_engine.enabled auf on fest:

  1. Führen Sie den ALTER SYSTEM PostgreSQL-Befehl aus:

    ALTER SYSTEM SET google_columnar_engine.enabled = 'on'
    
  2. Wenn Sie die Konfiguration der spaltenbasierten Engine anpassen möchten, folgen Sie der Anleitung im nächsten Abschnitt, bevor Sie den Datenbankserver neu starten. Andernfalls führen Sie den folgenden Schritt aus, um den Datenbankserver jetzt neu zu starten.

  3. Damit die Änderungen an den Konfigurationsparametern wirksam werden, starten Sie den Container mit AlloyDB Omni neu.

    Docker

      sudo docker restart CONTAINER_NAME

    Podman

      sudo podman restart CONTAINER_NAME

Größe des Spaltenspeichers konfigurieren

Wenn die spaltenbasierte Engine auf einer Instanz aktiviert ist, weist AlloyDB Omni einen Teil des Arbeitsspeichers der Instanz zu, um die spaltenbasierten Daten zu speichern. Wenn Sie Ihrem Spaltenspeicher schnellen RAM zuweisen, kann AlloyDB Omni so schnell wie möglich auf die spaltenbasierten Daten zugreifen.

Arbeitsspeicher und Speichercache stellen zusammen die Gesamtkapazität der spaltenbasierten Engine dar.

Arbeitsspeicher konfigurieren

Sie können die Zuweisung mit dem google_columnar_engine.memory_size_in_mb Flag auf eine feste Größe festlegen.

Einzelserver

So legen Sie das Flag google_columnar_engine.memory_size_in_mb für eine Instanz fest:

  1. Konfigurieren Sie den Arbeitsspeicher, indem Sie den ALTER SYSTEM PostgreSQL-Befehl ausführen:

    ALTER SYSTEM SET google_columnar_engine.memory_size_in_mb = COLUMN_MEMORY_SIZE;
    

    Ersetzen Sie COLUMN_MEMORY_SIZE durch die neue Größe des Spaltenspeichers in Megabyte, z. B. 256.

  2. Damit die Änderungen an den Konfigurationsparametern wirksam werden, starten Sie den Container mit AlloyDB Omni neu.

    Docker

    sudo docker restart CONTAINER_NAME

    Podman

    sudo podman restart CONTAINER_NAME

Speichercache konfigurieren

Einzelserver

Sie können den Speichercache der spaltenbasierten Engine entweder auf dedizierten oder gemeinsam verwendeten Geräten konfigurieren.

Dedizierte Geräte

Auf dedizierten Geräten müssen Sie Laufwerke bereitstellen und ein Dateisystem erstellen, um den Speichercache der spaltenbasierten Engine von AlloyDB Omni für einen Einzelserver-Container zu aktivieren. Anschließend müssen Sie das Cacheverzeichnis in AlloyDB Omni einbinden und schließlich den spaltenbasierten Speichercache aktivieren.

Laufwerke bereitstellen und ein Dateisystem erstellen

Wenn Sie Laufwerke bereitstellen und ein Dateisystem für den Speichercache der spaltenbasierten Engine von AlloyDB Omni erstellen möchten, erstellen Sie ein Dateisystem auf einer oder mehreren Festplatten und stellen es in einem Container mit AlloyDB Omni bereit. Außerdem können Sie Dienstprogramme wie mdadm oder lvm verwenden, um die Kapazität mit mehreren Festplatten zu bündeln und ein beliebiges Dateisystem zu verwenden. Die folgenden Schritte zeigen, wie Sie lvm und ext4 auf einer Ubuntu Compute Engine-Instanz mit NVMe-SSDs verwenden.

  1. Erstellen Sie eine Volume-Gruppe aus allen verfügbaren physischen Geräten:

    nvme_prefix="STORAGE_PREFIX"
    nvme_list=$(ls "$nvme_prefix"*)
    sudo vgcreate VOLUME_GROUP ${nvme_list}

    Ersetzen Sie Folgendes:

    • STORAGE_PREFIX: Das Präfix des Pfads der lokalen Ziellaufwerke, die über die NVMe-Schnittstelle (Nonvolatile Memory Express) an eine VM angehängt sind. Auf Google Cloudbeginnen die NVMe-Gerätepfade beispielsweise immer mit /dev/nvme0n.
    • VOLUME_GROUP: Der Name einer Volumegruppe, in der Ihre SSDs kombiniert sind, z. B. omni-disk-cache-volume.
  2. Verwenden Sie den folgenden Befehl, um ein logisches Volume aus der kostenlosen Kapazität der Volumegruppe aus dem vorherigen Schritt zu erstellen:

    sudo lvcreate -n LOGICAL_VOLUME -l 100%FREE VOLUME_GROUP

    Ersetzen Sie LOGICAL_VOLUME durch den Namen eines logischen Volumes, das vom LVM als Partition behandelt wird, z. B. omni_disk_cache_device.

  3. Erstellen Sie das ext4-Dateisystem auf dem logischen Volume. Bei Bedarf können Sie andere ext4-Optionen angeben, die der Datensicherheit unterliegen.
    sudo mkfs.ext4 /dev/VOLUME_GROUP/LOGICAL_VOLUME
  4. Verwenden Sie den folgenden Befehl, um ein Verzeichnis als Bereitstellungspunkt auf dem Hostcomputer zu erstellen und das Dateisystem bereitzustellen:

    sudo mkdir /OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY
    sudo mount /dev/VOLUME_GROUP/LOGICAL_VOLUME /OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY

    Ersetzen Sie OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY durch den Namen des Verzeichnisses oder einen Pfad zu dem Verzeichnis, das als Bereitstellungspunkt dient, z. B. omni_columnar_storage_cache_directory.

Spaltenspeicher-Cacheverzeichnis in AlloyDB Omni einbinden

Bevor Sie den Datenträger-Cache für AlloyDB Omni aktivieren, das in einem Container ausgeführt wird, müssen Sie das Cacheverzeichnis in AlloyDB Omni einbinden.

Informationen zur Installation von AlloyDB Omni über ein Docker-Image und zur Anpassung finden Sie unter AlloyDB Omni-Installation anpassen.

Verwenden Sie den folgenden Befehl, um OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY in Ihrem Docker-Container mit AlloyDB Omni bereitzustellen:

Docker

  sudo docker run --name CONTAINER_NAME 
-e POSTGRES_PASSWORD=PASSWORD
-e PGDATA=/var/lib/postgresql/data/pgdata
-v DATA_DIR:/var/lib/postgresql/data
-v /OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY:/CACHE_DIRECTORY_PATH_INSIDE_CONTAINER
-d google/alloydbomni

Ersetzen Sie Folgendes:

  • CONTAINER_NAME: Der Name, der dem neuen AlloyDB Omni-Container zugewiesen werden soll, z. B. my-omni.
  • PASSWORD: Das Passwort für den PostgreSQL-Datenbank-Root-Administrator.
  • DATA_DIR: Der Dateisystempfad, den AlloyDB Omni für sein Datenverzeichnis verwenden soll.
  • CACHE_DIRECTORY_PATH_INSIDE_CONTAINER: Das Cacheverzeichnis im AlloyDB Omni-Container, das dem Bereitstellungspunkt auf dem Hostcomputer zugeordnet ist, z. B. basierend auf dem Wert des Cacheverzeichnisses im Container entweder /omni_disk_cache_directory, ähnlich wie OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY, oder /disk/cache/inside/container.

Podman

  podman run --name CONTAINER_NAME 
-e POSTGRES_PASSWORD=PASSWORD
-e PGDATA=/var/lib/postgresql/data/pgdata
-v DATA_DIR:/var/lib/postgresql/data
-v /OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY:/CACHE_DIRECTORY_PATH_INSIDE_CONTAINER
-d docker.io/google/alloydbomni

Ersetzen Sie Folgendes:

  • CONTAINER_NAME: Der Name, der dem neuen AlloyDB Omni-Container zugewiesen werden soll, z. B. my-omni.
  • PASSWORD: Das Passwort für den PostgreSQL-Datenbank-Root-Administrator.
  • CACHE_DIRECTORY_PATH_INSIDE_CONTAINER: Das Cacheverzeichnis im AlloyDB Omni-Container, das dem Bereitstellungspunkt auf dem Hostcomputer zugeordnet ist, z. B. basierend auf dem Wert des Cacheverzeichnisses im Container entweder /omni_columnar_storage_cache_directory, ähnlich wie OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY, oder /disk/cache/inside/container.

Verwenden Sie die folgenden Befehle, um dem eingebundenen OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY vollständige Zugriffsrechte zu gewähren:

Docker

  sudo docker exec -it CONTAINER_NAME chown postgres:postgres /CACHE_DIRECTORY_PATH_INSIDE_CONTAINER
  sudo docker exec -it CONTAINER_NAME chmod -R a+rw  /CACHE_DIRECTORY_PATH_INSIDE_CONTAINER
  

Podman

  sudo podman exec -it CONTAINER_NAME chown postgres:postgres /CACHE_DIRECTORY_PATH_INSIDE_CONTAINER
  sudo podman exec -it CONTAINER_NAME chmod -R a+rw  /CACHE_DIRECTORY_PATH_INSIDE_CONTAINER
  

Spaltenspeicher-Cache von AlloyDB Omni für AlloyDB Omni aktivieren, das in einem Container ausgeführt wird

Wenn Sie den spaltenbasierten Speichercache von AlloyDB Omni auf dedizierten Geräten für Ihre Datenbank aktivieren möchten, legen Sie die entsprechenden GUC-Parameter (Grand Unified Configuration) fest, nachdem Sie dafür gesorgt haben, dass das eingebundene Cacheverzeichnis aus dem Docker-Container heraus zugänglich ist.

  1. Legen Sie das Verzeichnis für den spaltenbasierten Speichercache fest:

    ALTER SYSTEM SET google_columnar_engine.omni_storage_cache_directory = OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY;
    

    Ersetzen Sie OMNI_COLUMNAR_STORAGE_CACHE_DIRECTORY durch den absoluten Pfad zu dem dedizierten Verzeichnis, in dem AlloyDB Omni die Cachedateien des spaltenbasierten Speichers speichern soll. Prüfen Sie, ob dieses Verzeichnis vorhanden ist und der Datenbanknutzer die entsprechenden Schreibberechtigungen hat.

  2. Konfigurieren Sie die Größe des Speichercaches:

    ALTER SYSTEM SET google_columnar_engine.storage_cache_size = STORAGE_CACHE_SIZE;
    

    Ersetzen Sie STORAGE_CACHE_SIZE durch die gewünschte Größe des spaltenbasierten Speichercaches in Megabyte. Standardmäßig wird die gesamte Größe des zweckbestimmten Geräts der spaltenbasierten Engine zugewiesen, ohne den Datenträger-Cache zu beeinträchtigen. Der maximal zulässige Wert für dieses Flag ist das Minimum aus 1000 * google_columnar_engine.memory_size_in_mb.

  3. Damit die Änderungen an den Konfigurationsparametern wirksam werden, starten Sie den Container mit AlloyDB Omni neu.

    Docker

    sudo docker restart CONTAINER_NAME

    Podman

    sudo podman restart CONTAINER_NAME

Gemeinsam verwendete Geräte

Bevor Sie den spaltenbasierten Speichercache für gemeinsam verwendete Geräte mit Laufwerks-Cache konfigurieren, müssen Sie den Laufwerks-Cache von AlloyDB Omni aktivieren.

Konfigurieren Sie den Speichercache auf gemeinsam verwendeten Geräten so:

  1. Konfigurieren Sie den Speichercache:

    ALTER SYSTEM SET google_columnar_engine.storage_cache_size = STORAGE_CACHE_SIZE;
    

    Ersetzen Sie STORAGE_CACHE_SIZE durch die gewünschte Größe des Speichercaches in Megabyte. Standardmäßig werden 5% des Datenträger-Caches der spaltenbasierten Engine zugewiesen. Der maximal zulässige Wert für dieses Flag ist das Minimum aus 50% des gesamten Datenträger-Caches oder 1000 * google_columnar_engine.memory_size_in_mb.

  2. Damit die Änderungen an den Konfigurationsparametern wirksam werden, starten Sie den Container mit AlloyDB Omni neu.

    Docker

    sudo docker restart CONTAINER_NAME

    Podman

    sudo podman restart CONTAINER_NAME

Vektorisierte Verknüpfung aktivieren

Die spaltenbasierte Engine verfügt über eine Funktion für vektorisierte Verknüpfungen, mit der die Leistung von Verknüpfungen verbessert werden kann, indem vektorisierte Verarbeitung auf entsprechende Abfragen angewendet wird.

Nachdem Sie die vektorisierte Verknüpfung aktiviert haben, kann der AlloyDB-Abfrageplaner den vektorisierten Verknüpfungsoperator anstelle des Standard-PostgreSQL-Hash-Verknüpfungsoperators anwenden. Der Planer trifft diese Entscheidung, indem er die Kosten für die Ausführung der Abfrage mit jeder Methode vergleicht.

Wenn Sie die vektorisierte Verknüpfung auf einer Instanz aktivieren möchten, legen Sie das google_columnar_engine.enable_vectorized_join Flag der Instanz auf on fest.

Führen Sie den ALTER SYSTEM PostgreSQL-Befehl aus, um dieses Flag für eine Instanz festzulegen:

ALTER SYSTEM SET google_columnar_engine.enable_vectorized_join = 'on';

Standardmäßig weist AlloyDB Omni der Funktion für vektorisierte Verknüpfungen einen Thread zu. Sie können die Anzahl der für diese Funktion verfügbaren Threads erhöhen, indem Sie das google_columnar_engine.vectorized_join_threads Flag auf einen größeren Wert festlegen. Der Maximalwert ist cpu_count * 2.

Spaltenbasierte Engine manuell aktualisieren

Wenn die spaltenbasierte Engine aktiviert ist, wird der Spaltenspeicher standardmäßig im Hintergrund aktualisiert.

Führen Sie die folgende SQL-Abfrage aus, um die spaltenbasierte Engine manuell zu aktualisieren:

SELECT google_columnar_engine_refresh(relation =>'TABLE_NAME');

Ersetzen Sie TABLE_NAME durch den Namen der Tabelle oder der materialisierten Ansicht, die Sie manuell aktualisieren möchten.

Spaltenbasierte Engine deaktivieren

Wenn Sie die spaltenbasierte Engine auf einer Instanz deaktivieren möchten, legen Sie das Flag google_columnar_engine.enabled auf off fest.

Einzelserver

So legen Sie google_columnar_engine.enabled auf off fest:

  1. Führen Sie den ALTER SYSTEM PostgreSQL-Befehl aus:
ALTER SYSTEM SET google_columnar_engine.enabled = 'off'
  1. Damit die Änderungen an den Konfigurationsparametern wirksam werden, starten Sie den Container mit AlloyDB Omni neu.

Docker

Führen Sie den docker container restart Befehl aus, um einen AlloyDB Omni-Container neu zu starten:

  sudo docker restart CONTAINER_NAME

Ersetzen Sie CONTAINER_NAME durch den Namen, den Sie dem AlloyDB Omni-Container bei der Installation zugewiesen haben.

Podman

Führen Sie den podman container start Befehl aus, um einen AlloyDB Omni-Container neu zu starten:

  sudo podman restart CONTAINER_NAME

Ersetzen Sie CONTAINER_NAME durch den Namen, den Sie dem AlloyDB Omni-Container bei der Installation zugewiesen haben.

Fehlerbehebung bei der spaltenbasierten Engine

Fehler insufficient shared memory beheben

Wenn Sie AlloyDB Omni mit zu wenig gemeinsam genutztem Arbeitsspeicher für die spaltenbasierte Engine ausführen, wird möglicherweise dieser Fehler angezeigt:

Insufficient shared memory for generating the columnar formats.

Sie können dieses Problem beheben, indem Sie die Menge des gemeinsam genutzten Arbeitsspeichers angeben, der dem AlloyDB Omni-Container zur Verfügung steht. Die Vorgehensweise hängt vom Betriebssystem des Hosts ab.

Linux

Erhöhen Sie die Größe der Partition /dev/shm Ihres Hostcomputers, z. B. durch Bearbeiten der Datei /etc/fstab.

macOS

Installieren Sie einen neuen AlloyDB Omni-Container, und geben Sie einen größeren Wert für den gemeinsam genutzten Arbeitsspeicher für das Flag --shm-size an.

Sichern Sie Ihre Daten, bevor Sie zu einem neuen Container wechseln.

Problem beheben, dass Spalten nicht gefüllt werden

Wenn Spalten in der spaltenbasierten Engine nicht gefüllt werden, kann einer der folgenden Gründe vorliegen:

  • Die Spalten, die Sie hinzufügen möchten, enthalten einen nicht unterstützten Datentyp.

  • Die Anforderungen der spaltenbasierten Engine werden nicht erfüllt.

So beheben Sie dieses Problem:

  • Bestätigen Sie, dass die Tabellen oder materialisierten Ansichten in der Abfrage in der spaltenbasierten Engine vorhanden sind.
  • Prüfen Sie die Verwendung der spaltenbasierten Engine mit der EXPLAIN Anweisung.

Nächste Schritte