בדף הזה מוסבר איך לכוונן את האינדקסים כדי לשפר את הביצועים של השאילתות ואת הדיוק ב-AlloyDB ל-PostgreSQL.
לפני שמתחילים
לפני שיוצרים אינדקס ScaNN, צריך לבצע את הפעולות הבאות:
יוצרים טבלה עם הנתונים.
כדי להימנע מבעיות של חוסר זיכרון כשיוצרים את אינדקס ScaNN, צריך לוודא שדגלי מסד הנתונים
maintenance_work_memו-shared_buffersמוגדרים לערך שקטן מסך הזיכרון של המכונה.כדי להשתמש באינדקסים עם ארבע רמות, צריך קודם להפעיל את התכונה תצוגה מקדימה במופע AlloyDB. כדי להפעיל את תכונת התצוגה המקדימה, בוחרים באחת משתי השיטות הבאות:
מפעילים את דגל מסד הנתונים
scann.enable_preview_features.מידע נוסף על הגדרת דגלים של מסד נתונים זמין במאמר הגדרת דגלים של מסד נתונים.
מגדירים את הדגל
scann.max_allowed_num_levelsשל מסד הנתונים ברמת הסשן לערך3.SET scann.max_allowed_num_levels = 3;
שיפור של אינדקס ScaNN
כדי לקבוע את מספר הרמות שנדרשות לאינדקס ScaNN, אפשר להיעזר בטבלה הבאה.
| מספר השורות של הווקטור בטבלה | מספר הרמות באינדקס ScaNN |
|---|---|
| [0..10 מיליון] | שניים |
| [10 מיליון..100 מיליון] |
בוחרים אחד מהמדדים הבאים כדי לתת לו עדיפות:
|
| [100 מיליון..מיליארד] |
בוחרים אחד מהמדדים הבאים כדי לתת לו עדיפות:
|
| [מיליארד אחד..10 מיליארד] | ארבע (בתצוגה מקדימה) |
בדוגמאות הבאות מוצגים אינדקסים של ScaNN שאפשר להשתמש בהם כדי לשנות את הפרמטרים של טבלה עם מיליון שורות.
אינדקס של עץ עם שתי רמות
SET LOCAL scann.num_leaves_to_search = 1; SET LOCAL scann.pre_reordering_num_neighbors=50; CREATE INDEX my_scann_index ON my_table USING scann (vector_column cosine) WITH (num_leaves = [power(1000000, 1/2)]);
אינדקס עץ ברמה שלישית
SET LOCAL scann.num_leaves_to_search = 10; SET LOCAL scann.pre_reordering_num_neighbors=50; CREATE INDEX my_scann_index ON my_table USING scann (vector_column cosine) WITH (num_leaves = [power(1000000, 2/3)], max_num_levels = 2);
מדד עץ עם ארבע רמות
SET LOCAL scann.num_leaves_to_search = 100; SET LOCAL scann.pre_reordering_num_neighbors=50; CREATE INDEX my-scann-index ON my-table USING scann (vector_column cosine) WITH (num_leaves = [power(1000000, 3/4)], max_num_levels = 3);
מידע נוסף על אינדקסים של ScaNN זמין בדפים הבאים:
טיפול בביטולים של DML בגלל האצה באמצעות מנוע מבוסס-עמודות
אם בחרתם להאיץ את חיפושי הווקטורים באמצעות מנוע עמודות, חשוב לדעת שביטולים של DML ו-DDL בטבלאות הבסיס יכולים להשפיע על הביצועים של שאילתות וקטוריות. במקרה של תפוקת DML גבוהה, כדאי לשקול כוונון של דגל מסד הנתונים google_columnar_engine.refresh_threshold_percentage או רענון ידני של האינדקס באמצעות הפקודה google_columnar_engine_refresh_index.
ניתוח השאילתות
כדי לנתח את התובנות לגבי השאילתה, משתמשים בפקודה EXPLAIN ANALYZE, כמו בדוגמה הבאה של שאילתת SQL.
EXPLAIN ANALYZE SELECT result-column
FROM my_table
ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
LIMIT 1;
תגובת הדוגמה QUERY PLAN כוללת מידע כמו הזמן שחלף, מספר השורות שנסרקו או הוחזרו והמשאבים שהיו בשימוש.
Limit (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
-> Index Scan using my_scann_index on my_table (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms
צפייה במדדים של אינדקס וקטורים
אתם יכולים להשתמש במדדים של אינדקס וקטורי כדי לבדוק את הביצועים של האינדקס הווקטורי, לזהות תחומים לשיפור ולשנות את האינדקס על סמך המדדים, אם צריך. התצוגה pg_stat_ann_indexes עוזרת להבין את מצב השימוש באינדקס, והתצוגה pg_stat_ann_index_creation מספקת מידע על השורות שנוצרו בזמן יצירת האינדקס.
כדי לראות את מדדי הניצול של האינדקס, מריצים את הפקודה הבאה:
SELECT * FROM pg_stat_ann_indexes;
הפלט אמור להיראות כך:
-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid | 271236
indexrelid | 271242
schemaname | public
relname | t1
indexrelname | t1_ix1
indextype | scann
indexconfig | {num_leaves=100,max_num_levels=1,quantizer=SQ8}
indexsize | 832 kB
indexscan | 0
insertcount | 250
deletecount | 0
updatecount | 0
partitioncount | 100
distribution | {"average": 3.54, "maximum": 37, "minimum": 0, "outliers": [37, 12, 11, 10, 10, 9, 9, 9, 9, 9]}
distributionpercentile |{"10": { "num_vectors": 0, "num_partitions": 0 }, "25": { "num_vectors": 0, "num_partitions": 30 }, "50": { "num_vectors": 3, "num_partitions": 30 }, "75": { "num_vectors": 5, "num_partitions": 19 }, "90": { "num_vectors": 7, "num_partitions": 11 }, "95": { "num_vectors": 9, "num_partitions": 5 }, "99": { "num_vectors": 12, "num_partitions": 4 }, "100": { "num_vectors": 37, "num_partitions": 1 }}
כדי לראות את מספר השורות שנוצרו בזמן יצירת האינדקס, מריצים את הפקודה הבאה:
SELECT * FROM pg_stat_ann_index_creation;
הפלט אמור להיראות כך:
-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid | 271236
indexrelid | 271242
schemaname | public
relname | t1
indexrelname | t1_ix1
index_rows_at_creation_time | 262144
למידע נוסף על הרשימה המלאה של המדדים, אפשר לעיין במאמר מדדים של אינדקס וקטורי.