Messwerte für Vektorindex

Wählen Sie eine Dokumentationsversion aus:

Auf dieser Seite werden die Messwerte für die Vektorindexe aufgeführt, die Sie in AlloyDB Omni generieren. Sie können diese Messwerte mit der Ansicht pg_stat_ann_indexes aufrufen, die verfügbar ist, wenn Sie die Erweiterung alloydb_scann installieren.

Weitere Informationen zum Aufrufen der Messwerte finden Sie unter Messwerte für Vektorindexe aufrufen.

Messwerte zur Verwendbarkeit

Die Messwerte zur Verwendbarkeit umfassen Messwerte, mit denen Sie den Status der Indexnutzung nachvollziehen können, z. B. die Indexkonfiguration und die Anzahl der Indexscans.

Messwertname Datentyp Beschreibung
relid OID Eindeutige Kennung der Tabelle, die den Vektorindex enthält
indexrelid OID Eindeutige Kennung des Vektorindex
schemaname NAME Name des Schemas, das Inhaber des Index ist
relname NAME Name der Tabelle, die den Index enthält
indexrelname NAME Name des Index
indextype NAME Typ des Index. Dieser Wert ist immer auf alloydb_scann festgelegt.
indexconfig TEXT[] Konfiguration, z. B. Anzahl der Blätter und Quantifizierer, die für den Index bei seiner Erstellung definiert wurden
indexsize TEXT Größe des Index
indexscan BIGINT Anzahl der Indexscans, die für den Index initiiert wurden
partitioncount BIGINT Anzahl der Partitionen (Blattknoten) in der Struktur.

Abstimmungsmesswerte

Abstimmungsmesswerte liefern Einblicke in die aktuelle Indexoptimierung, sodass Sie Empfehlungen für eine schnellere Abfrageleistung anwenden können.

Messwertname Datentyp Beschreibung
insertcount BIGINT Anzahl der Einfügevorgänge für den Index. Dieser Messwert umfasst auch die Anzahl der Zeilen, die vor der Erstellung des Index vorhanden waren.
updatecount BIGINT Anzahl der Aktualisierungsvorgänge für den Index. Bei diesem Messwert werden keine HOT-Aktualisierungen berücksichtigt.
deletecount BIGINT Anzahl der Löschvorgänge für den Index.
distribution JSONB Vektorverteilungen über alle Partitionen für den Index.

In den folgenden Feldern wird die Verteilung angezeigt:
  • maximum (INT8): Maximale Anzahl von Vektoren über alle Partitionen hinweg.
  • minimum (INT8): Minimale Anzahl von Vektoren über alle Partitionen hinweg.
  • average (FLOAT) : Durchschnittliche Anzahl von Vektoren über alle Partitionen hinweg.
  • outliers (INT8[]): Top-Ausreißer über alle Partitionen hinweg. Dieser Wert zeigt die 20 größten Ausreißer.

Hinweis:Aufgrund der inhärenten Eigenschaften des K-Means-Clustering-Algorithmus gibt es immer eine gewisse Varianz in der Verteilung der Vektoren über die Partitionen hinweg, auch wenn der Index ursprünglich erstellt wird.

Abstimmungsempfehlung basierend auf den Messwerten

Mutation
Die Messwerte insertcount, updatecount, und deletecount zeigen zusammen die Änderungen oder Mutationen im Vektor für den Index.
Der Index wird mit einer bestimmten Anzahl von Vektoren und Partitionen erstellt. Wenn Vorgänge wie Einfügen, Aktualisieren oder Löschen für den Vektorindex ausgeführt werden, wirkt sich dies nur auf die ursprüngliche Gruppe von Partitionen aus, in denen sich die Vektoren befinden. Daher schwankt die Anzahl der Vektoren in jeder Partition im Laufe der Zeit, was sich möglicherweise auf den Recall, die Rate von Abfragen pro Sekunde oder beides auswirkt.
Wenn bei Ihren ANN-Suchanfragen im Laufe der Zeit Probleme mit der Geschwindigkeit oder Genauigkeit auftreten, z. B. eine niedrige Rate von Abfragen pro Sekunde oder ein schlechter Recall, sollten Sie diese Messwerte überprüfen. Eine hohe Anzahl von Mutationen im Verhältnis zur Gesamtzahl der Vektoren kann darauf hindeuten, dass eine Neuindexierung erforderlich ist.
Verteilung
Der Messwert distribution zeigt die Vektorverteilungen über alle Partitionen hinweg.
Wenn Sie einen Index erstellen, wird er mit einer bestimmten Anzahl von Vektoren und festen Partitionen erstellt. Der Partitionierungsprozess und die anschließende Verteilung erfolgen auf dieser Grundlage. Wenn zusätzliche Vektoren hinzugefügt werden, werden sie auf die vorhandenen Partitionen verteilt, was zu einer anderen Verteilung führt als bei der Erstellung des Index. Da bei der endgültigen Verteilung nicht alle Vektoren gleichzeitig berücksichtigt werden, kann sich dies auf den Recall, die Rate von Abfragen pro Sekunde oder beides auswirken.
Wenn Sie einen allmählichen Rückgang der Leistung Ihrer ANN-Suchanfragen feststellen, z. B. langsamere Reaktionszeiten oder eine geringere Genauigkeit der Ergebnisse (gemessen an der Rate von Abfragen pro Sekunde oder dem Recall), sollten Sie diesen Messwert überprüfen und eine Neuindexierung durchführen.