Best Practices für die Optimierung von ScaNN-Indexen

Wählen Sie eine Dokumentationsversion aus:

Folgen Sie den Best Practices, um Ihre ScaNN-Indexe zu optimieren und ein Gleichgewicht zwischen Such-Recall und Abfragen pro Sekunde (Queries per Second, QPS) zu erreichen. Je nachdem, wie viele Ebenen Ihr Index hat, ändern sich die empfohlenen Parameter und Werte.

Informationen zum Erstellen von ScaNN-Indexen finden Sie unter ScaNN-Index erstellen.

Limits

Bevor Sie mit der Optimierung Ihrer ScaNN-Indexe beginnen, beachten Sie das folgende Limit:

Hinweis

Wenn Sie einen ScaNN-Index mit vier Ebenen erstellen möchten, müssen Sie zuerst die Vorschau-Funktion für Ihre AlloyDB-Instanz aktivieren. Wählen Sie eine der folgenden beiden Methoden aus, um die Vorschau-Funktion zu aktivieren:

Zweistufiger Baumindex

So wenden Sie Empfehlungen an, um die optimalen Werte für num_leaves und num_leaves_to_search für Ihren Datensatz zu ermitteln:

  1. Wenn Sie den für die folgenden Fälle optimierten ScaNN-Index erstellen möchten, legen Sie den Parameter num_leaves auf den folgenden Wert fest, wobei „rows“ die Anzahl der Zeilen in der indexierten Tabelle ist:
    • Ausgewogene Index-Build-Dauer und ‑qualität: Setzen Sie num_leaves auf sqrt(rows).
    • Bei quality wird „num_leaves“ auf „rows/100“ festgelegt.
  2. Führen Sie Ihre Testabfragen aus und erhöhen Sie den Wert von scann.num_of_leaves_to_search, bis Sie den gewünschten Recall-Bereich erreichen, z. B. 95 %. Weitere Informationen zum Analysieren von Abfragen finden Sie unter Abfragen analysieren.
  3. Notieren Sie sich das Verhältnis zwischen scann.num_leaves_to_search und num_leaves, das in den nachfolgenden Schritten verwendet wird. Dieses Verhältnis bietet eine Annäherung an den Datensatz, mit dem Sie den angestrebten Recall erreichen können.

    Wenn Sie mit Vektoren mit hoher Dimension (500 Dimensionen oder mehr) arbeiten und den Recall verbessern möchten, versuchen Sie, den Wert von scann.pre_reordering_num_neighbors zu optimieren. Der Standardwert ist auf 50 * K festgelegt, wobei K das Limit ist, das Sie in Ihrer Abfrage festgelegt haben.
  4. Wenn Ihre Rate von Abfragen pro Sekunde zu niedrig ist, nachdem Ihre Anfragen ein bestimmtes Ziel für den Recall erreicht haben, gehen Sie so vor:
    1. Erstellen Sie den Index neu und erhöhen Sie den Wert von num_leaves und scann.num_leaves_to_search gemäß der folgenden Anleitung:
      • Setzen Sie num_leaves auf einen größeren Faktor der Quadratwurzel der Anzahl der Zeilen. Wenn der Index beispielsweise num_leaves auf die Quadratwurzel der Zeilenanzahl festgelegt hat, versuchen Sie, ihn auf das Doppelte der Quadratwurzel festzulegen. Wenn der Wert bereits verdoppelt wurde, versuchen Sie, ihn auf das Dreifache der Quadratwurzel zu setzen.
      • Erhöhen Sie scann.num_leaves_to_search nach Bedarf, um das Verhältnis zu num_leaves beizubehalten, das Sie in Schritt 3 notiert haben.
      • Legen Sie für num_leaves einen Wert fest, der kleiner oder gleich der Zeilenanzahl geteilt durch 100 ist.
    2. Führen Sie die Testabfragen noch einmal aus. Während Sie die Testabfragen ausführen, können Sie mit einer Reduzierung von scann.num_leaves_to_search experimentieren, um einen Wert zu finden, der die Anzahl der Abfragen pro Sekunde erhöht und gleichzeitig den Recall hoch hält. Sie können verschiedene Werte für scann.num_leaves_to_search ausprobieren, ohne den Index neu erstellen zu müssen.
  5. Wiederholen Sie Schritt 4, bis sowohl die Abfragen pro Sekunde als auch der Recall-Bereich akzeptable Werte erreicht haben.

Baumindex mit drei Ebenen

Zusätzlich zu den Empfehlungen für den ScaNN-Index mit zwei Stufen sollten Sie die folgenden Hinweise beachten.

So wenden Sie Empfehlungen an, um den optimalen Wert der Indexparameter num_leaves und max_num_levels zu ermitteln:

  1. Erstellen Sie den ScaNN-Index mit den folgenden num_leaves- und max_num_levels-Kombinationen, die auf Ihren Leistungszielen basieren:

    • Index-Build-Dauer und ‑qualität ausgleichen: Legen Sie max_num_levels als 2 und num_leaves als power(rows, ⅔) fest.
    • Für Qualität optimieren: Legen Sie max_num_levels auf 2 und num_leaves auf rows/100 fest.
  2. Führen Sie Ihre Testabfragen aus. Weitere Informationen zum Analysieren von Abfragen finden Sie unter Abfragen analysieren.

  3. Notieren Sie sich das Verhältnis zwischen scann.num_leaves_to_search und num_leaves, das in den nachfolgenden Schritten verwendet wird. Dieses Verhältnis bietet eine Schätzung für das Dataset, mit dem Sie den angestrebten Recall erreichen können.

Wenn Sie mit Vektoren mit vielen Dimensionen (500 oder mehr) arbeiten und den Recall verbessern möchten, versuchen Sie, den Wert von scann.pre_reordering_num_neighbors zu optimieren. Der Standardwert ist auf 50 * K festgelegt, wobei K das Limit ist, das Sie in Ihrer Abfrage festgelegt haben.

  1. Wenn Ihre Rate von Abfragen pro Sekunde zu niedrig ist, nachdem Ihre Anfragen ein bestimmtes Ziel für den Recall erreicht haben, gehen Sie so vor:

    • Erstellen Sie den Index neu und erhöhen Sie die Werte von num_leaves und scann.num_leaves_to_search gemäß der folgenden Anleitung:
    • Setzen Sie num_leaves auf einen größeren Faktor von power(rows, ⅔). Wenn der Index beispielsweise num_leaves auf power(rows, ⅔) gesetzt hat, versuchen Sie, ihn auf das Doppelte von power(rows, ⅔) zu setzen. Wenn der Wert bereits doppelt ist, versuchen Sie, ihn auf das Dreifache von power(rows, ⅔) zu setzen.
    • Erhöhen Sie scann.num_leaves_to_search nach Bedarf, um das Verhältnis zu num_leaves beizubehalten, das Sie in Schritt 3 notiert haben.
    • Setzen Sie num_leaves auf einen Wert, der kleiner oder gleich rows/100 ist.
    • Führen Sie die Testabfragen noch einmal aus. Während Sie die Testabfragen ausführen, können Sie mit einer Reduzierung von scann.num_leaves_to_search experimentieren, um einen Wert zu finden, der die Anzahl der Abfragen pro Sekunde erhöht und gleichzeitig den Recall hoch hält. Sie können verschiedene Werte für scann.num_leaves_to_search ausprobieren, ohne den Index neu erstellen zu müssen.
  2. Wiederholen Sie Schritt 4, bis sowohl die Abfragen pro Sekunde als auch der Recall-Bereich akzeptable Werte erreicht haben.

Baumindex mit vier Ebenen

Zusätzlich zu den Empfehlungen für Baumindexe mit drei Ebenen sollten Sie die folgenden Hinweise beachten, um den optimalen Wert für num_leaves und max_num_levels zu ermitteln:

  1. Erstellen Sie einen ScaNN-Index mit den folgenden num_leaves und max_num_levels Kombinationen, die auf Ihren Leistungszielen basieren:

    • Index-Build-Dauer und ‑qualität ausgleichen: Legen Sie max_num_levels auf 3 und num_leaves als power(ROWS, 3/4) fest.

    • Für Qualität optimieren: Legen Sie max_num_levels auf 3 und num_leaves als ROWS/100 fest.

  2. Führen Sie Ihre Testabfragen aus. Weitere Informationen zum Analysieren von Abfragen finden Sie unter Abfragen analysieren.

  3. Notieren Sie sich das Verhältnis zwischen scann.num_leaves_to_search und num_leaves. Dieses Verhältnis verwenden Sie in den nachfolgenden Schritten, um den angestrebten Recall zu erreichen.

    Wenn Sie mit Vektoren mit hoher Dimension (500 Dimensionen oder mehr) arbeiten und den Recall verbessern möchten, versuchen Sie, den Wert von scann.pre_reordering_num_neighbors zu optimieren.

  4. Wenn Ihre Rate von Abfragen pro Sekunde zu niedrig ist, nachdem Ihre Anfragen ein bestimmtes Ziel für den Recall erreicht haben, dann erstellen Sie den Index neu und erhöhen Sie den Wert von num_leaves und scann.num_leaves_to_search gemäß der folgenden Anleitung:

    1. Setzen Sie num_leaves auf einen größeren Faktor von power(ROWS, 3/4). Wenn der Index beispielsweise auf num_leaves gesetzt hat, versuchen Sie, ihn auf das Doppelte zu setzen.power(ROWS, 3/4) Wenn der Wert bereits doppelt ist, versuchen Sie, ihn auf das Dreifache zu setzen.

    2. Erhöhen Sie scann.num_leaves_to_search nach Bedarf, um das Verhältnis zu num_leaves beizubehalten, das Sie in Schritt 3 notiert haben.

    3. Setzen Sie num_leaves auf einen Wert, der kleiner oder gleich ROWS/100 ist.

    4. Führen Sie die Testabfragen noch einmal aus. Während Sie die Testabfragen ausführen, können Sie mit einer Reduzierung von scann.num_leaves_to_search experimentieren. Finden Sie einen Wert, der die Anzahl der Abfragen pro Sekunde erhöht und gleichzeitig den Recall hoch hält. Sie können verschiedene Werte für scann.num_leaves_to_search ausprobieren, ohne den Index neu erstellen zu müssen.

  5. Wiederholen Sie Schritt 4, bis sowohl der Recall-Bereich als auch die Abfragen pro Sekunde akzeptable Werte erreichen.

Recall für gefilterte Suchanfragen verbessern

Wenn Sie eine KNN-Vektorsuche (K-Nearest Neighbor) mit einem Filter durchführen, kann es vorkommen, dass die Abfrage weniger Ergebnisse zurückgibt als in der LIMIT-Klausel angefordert. Dies kann zu einem unzureichenden Recall führen und tritt häufiger auf, wenn hochselektive Filter verwendet werden. Das liegt daran, dass die anfänglichen Partitionen oder Blätter, die ScaNN durchsucht, nicht genügend Vektoren enthalten, die die Filterbedingungen erfüllen.

Um dieses Problem zu beheben, bietet AlloyDB Omni eine Funktion, mit der die Suche dynamisch über die anfängliche Menge von Blättern hinaus erweitert werden kann, um genügend übereinstimmende Ergebnisse zu finden.

Funktionsweise von Streaming

Sie können die Streaming-Funktion aktivieren, indem Sie den Parameter scann.satisfy_limit auf relaxed_order setzen. Wenn diese Funktion aktiviert ist, wird die Vektorsuche in zusätzlichen Blattpartitionen fortgesetzt, bis genügend Ergebnisse gefunden wurden, um das LIMIT Ihrer Abfrage zu erfüllen. Dadurch wird der Recall verbessert.

Um zu verhindern, dass eine Suche zu lange dauert, und um die Auswirkungen auf die Leistung zu kontrollieren, können Sie den Parameter scann.max_pct_leaves_to_search verwenden. Diese Einstellung dient als Schutzmaßnahme, indem sie eine Obergrenze für den Prozentsatz der Gesamtblätter festlegt, die eine Abfrage besuchen kann. Der Standardwert ist 15%.

Wann sollte Streaming verwendet werden?

Verwenden Sie die Streaming-Funktion in folgenden Fällen:

  • Sie verwenden Filter bei Ihren Vektorsuchen.
  • Ihre Abfragen geben weniger Ergebnisse zurück als erwartet, basierend auf Ihrer LIMIT-Klausel.

Wenn Sie scann.satisfy_limit aktivieren, können Sie den Recall Ihrer gefilterten Suchanfragen verbessern. Es wird empfohlen, auch scann.max_pct_leaves_to_search zu konfigurieren, um ein Gleichgewicht zwischen Recall und Abfrageleistung zu erreichen.

Indexwartung

Wenn Ihre Tabelle häufig aktualisiert wird oder neue Zeilen eingefügt werden, empfehlen wir, den vorhandenen ScaNN-Index regelmäßig neu zu indexieren, um die Genauigkeit des Recall zu verbessern. Sie können Indexmesswerte beobachten, um Änderungen an Vektorverteilungen oder Vektormutationen seit der Erstellung des Index zu sehen, und den Index dann entsprechend neu indexieren. Weitere Informationen zu Messwerten finden Sie unter Messwerte für Vektorindex ansehen.

Nächste Schritte