如需從頭到尾實作向量搜尋的逐步教學課程,請參閱執行向量搜尋指南。
調整參數
下列索引和查詢參數用於找出合適的召回率和每秒查詢次數 (QPS) 平衡點。
| 調整參數 | 說明 | 選項類型 |
|---|---|---|
mode |
將 ScaNN 索引定義為自動調整或手動調整的索引。可用選項如下:
詳情請參閱「建立 ScaNN 索引」。 |
建立索引 (選填) |
max_num_levels |
K-means 分群樹的群集中心層級數量上限。如需設定這個值的指引,請參閱「調整 ScaNN 索引」。 可用的值如下:
如果將 |
建立索引 (選填) |
num_leaves |
要套用至這個索引的分區數量。最大值為 30000000。如要進一步瞭解如何選擇這個值,請參閱「調整 ScaNN 索引」和「調整 ScaNN 索引的最佳做法」。 |
建立索引 (手動調整索引時必須提供) |
quantizer |
您要用於 K 平均值樹狀結構的量化器類型。預設值設為 SQ8,可提供更優異的查詢效能,且喚回率損失極小 (通常低於 1-2%)。如需 99% 以上的喚回率,請設為 FLAT。 |
建立索引 (選用) |
scann.enable_pca |
啟用主成分分析 (PCA),這是一種降維技術,可盡可能自動縮減嵌入的大小。這個選項預設為啟用。 如果發現召回率下降,請設為 false。 |
建立索引 (選用) |
auto_maintenance |
自動維護 ScaNN 索引,因此隨著資料集成長,AlloyDB Omni 會分析及更新質心,並分割大型離群值分區。這會自動提升 QPS 和搜尋結果。詳情請參閱「自動維護索引」。 |
建立索引 (選填) |
scann.pct_leaves_to_search |
自動管理向量索引搜尋的分區數量。詳情請參閱搜尋分區百分比。 | |
scann.num_leaves_to_search
|
要搜尋的分區絕對數量。這可讓您在查詢召回率和 QPS 之間進行取捨。預設值為 值越高,查詢喚回率就越高,但 QPS 會降低。同樣地,值越低,查詢喚回率越差,但 QPS 越好。 |
查詢執行階段 (選填) |
scann.pre_reordering_num_neighbors
|
指定初始搜尋作業找出候選項目後,要在重新排序階段考量的候選鄰點數量。將這個參數設為大於查詢要傳回的鄰項數值。值越高,喚回度越好,但 QPS 越低。
預設值為 |
查詢執行階段 (選填) |
scann.num_search_threads |
多執行緒搜尋的搜尋者執行緒數量。在對延遲時間較為敏感的應用程式中,使用多個執行緒進行 ScaNN ANN 搜尋,有助於縮短單一查詢的延遲時間。如果資料庫已受 CPU 限制,這項設定不會改善單一查詢延遲。預設值為 2。 |
查詢執行階段 (選用) |
|
設為 relaxed_order 時,資料庫旗標會解決召回率不足的問題。如果查詢的觀察召回率低於目標召回率,就可能發生召回率不足的情況,使用篩選器時更容易發生這種情況。這項設定可讓向量掃描繼續搜尋,直到找到足夠數量的結果為止,有助於達到目標召回率。num_leaves_to_search |
查詢執行階段 (選用) |
|
這個資料庫標記會為啟用 scann.satisfy_limit 執行的查詢,設定可造訪的葉節點總百分比上限。這是唯一可用的 GUC 上限,適用於自動和手動搜尋模式。避免搜尋過度,否則可能會大幅降低效能。啟用 scann.satisfy_limit 時,這項設定會生效。您可以將這個參數設為介於 0 到 100 之間的任何值。預設值為 15%。這個預設值的依據是,如果搜尋需要檢查超過 15% 的葉節點,篩選條件可能就夠精確,近似最鄰近搜尋 (ANN) 就不會帶來好處,因此預先篩選 K 近鄰 (KNN) 會是更合適的選擇。 |
查詢執行階段 (選用) |