במאמר הזה מוסבר איך לשפר את הביצועים של השאילתות ואת יכולת האחזור ב-AlloyDB Omni באמצעות כוונון של האינדקסים.
לפני שמתחילים
לפני שיוצרים אינדקס ScaNN, צריך לבצע את הפעולות הבאות:
- מוודאים שכבר נוצרה טבלה עם הנתונים.
- כדי למנוע בעיות במהלך יצירת האינדקס, צריך לוודא שהערך שמוגדר לדגל
maintenance_work_memולדגלshared_buffersנמוך מזיכרון המחשב הכולל. - כדי להשתמש באינדקסים עם ארבע רמות, קודם צריך להפעיל את תכונת התצוגה המקדימה במופע. כדי להפעיל את תכונת התצוגה המקדימה, בוחרים באחת משתי השיטות הבאות:
- מפעילים את דגל מסד הנתונים
scann.enable_preview_features. - מגדירים את הדגל
scann.max_allowed_num_levelsשל מסד הנתונים ברמת הסשן לערך3.sql SET scann.max_allowed_num_levels = 3;
- מפעילים את דגל מסד הנתונים
כוונון של אינדקס ScaNN
ההנחיות הבאות יעזרו לכם לקבוע כמה רמות צריך להגדיר באינדקס ScaNN:
- אם יש 0 עד 10 מיליון שורות: בוחרים אינדקס דו-רמתי.
- ל-10 מיליון עד 100 מיליון שורות:
- כדי לתת עדיפות לאחזור תוצאות החיפוש, בוחרים אינדקס דו-רמתי.
- כדי לתת עדיפות למשך זמן של תהליך build של האינדקס, בוחרים באינדקס ברמה 3.
- ל-100 מיליון עד מיליארד שורות:
- כדי לתת עדיפות לאחזור תוצאות החיפוש, בוחרים אינדקס עם שלוש רמות.
- כדי לתת עדיפות למשך זמן של תהליך build של האינדקס, בוחרים אינדקס ברמה 4 (בתצוגה מקדימה).
- אם יש מיליארד עד 10 מיליארד שורות: בוחרים אינדקס ברמה 4 (בתצוגה מקדימה).
בדוגמאות הבאות מוצגים אינדקסים של ScaNN בשתי רמות, בשלוש רמות ובארבע רמות, שמראים איך מגדירים פרמטרים של כוונון לטבלה עם 1,000,000 שורות:
אינדקס דו-רמתי
SET LOCAL scann.num_leaves_to_search = 1;
SET LOCAL scann.pre_reordering_num_neighbors=50;
CREATE INDEX my-scann-index ON my-table
USING scann (vector_column cosine)
WITH (num_leaves = [power(1000000, 1/2)]);
אינדקס עם שלוש רמות
SET LOCAL scann.num_leaves_to_search = 10;
SET LOCAL scann.pre_reordering_num_neighbors=50;
CREATE INDEX my-scann-index ON my-table
USING scann (vector_column cosine)
WITH (num_leaves = [power(1000000, 2/3)], max_num_levels = 2);
אינדקס עם ארבע רמות
(בתצוגה מקדימה)
SET LOCAL scann.num_leaves_to_search = 100;
SET LOCAL scann.pre_reordering_num_neighbors=50;
CREATE INDEX my-scann-index ON my-table
USING scann (vector_column cosine)
WITH (num_leaves = [power(1000000, 3/4)], max_num_levels = 3);
טיפול בביטולים של DML בגלל האצה באמצעות מנוע מבוסס-עמודות
אם בחרתם להאיץ את החיפושים הווקטוריים באמצעות מנוע העמודות, חשוב לדעת שביטולים של DML ו-DDL בטבלאות הבסיס יכולים להשפיע על הביצועים של שאילתות וקטוריות. במקרה של תפוקת DML גבוהה, כדאי לשקול כוונון של הדגל google_columnar_engine.refresh_threshold_percentage במסד הנתונים או רענון ידני של האינדקס באמצעות הפקודה google_columnar_engine_refresh_index.
ניתוח השאילתות
כדי לנתח את התובנות לגבי השאילתה, משתמשים בפקודה EXPLAIN ANALYZE, כמו בדוגמה הבאה של שאילתת SQL.
EXPLAIN ANALYZE SELECT result-column
FROM my-table
ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
LIMIT 1;
תגובת הדוגמה QUERY PLAN כוללת מידע כמו הזמן שחלף, מספר השורות שנסרקו או הוחזרו והמשאבים שהיו בשימוש.
Limit (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
-> Index Scan using my-scann-index on my-table (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms
צפייה במדדים של אינדקס וקטורים
אתם יכולים להשתמש במדדים של אינדקס הווקטורים כדי לבדוק את הביצועים של אינדקס הווקטורים, לזהות תחומים שצריך לשפר ולשפר את האינדקס על סמך המדדים, אם צריך.
כדי לראות את כל המדדים של אינדקס הווקטורים, מריצים את שאילתת ה-SQL הבאה, שמשתמשת בתצוגה pg_stat_ann_indexes:
SELECT * FROM pg_stat_ann_indexes;
הפלט אמור להיראות כך:
-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid | 271236
indexrelid | 271242
schemaname | public
relname | t1
indexrelname | t1_ix1
indextype | scann
indexconfig | {num_leaves=100,max_num_levels=1,quantizer=SQ8}
indexsize | 832 kB
indexscan | 0
insertcount | 250
deletecount | 0
updatecount | 0
partitioncount | 100
distribution | {"average": 3.54, "maximum": 37, "minimum": 0, "outliers": [37, 12, 11, 10, 10, 9, 9, 9, 9, 9]}
distributionpercentile |{"10": { "num_vectors": 0, "num_partitions": 0 }, "25": { "num_vectors": 0, "num_partitions": 30 }, "50": { "num_vectors": 3, "num_partitions": 30 }, "75": { "num_vectors": 5, "num_partitions": 19 }, "90": { "num_vectors": 7, "num_partitions": 11 }, "95": { "num_vectors": 9, "num_partitions": 5 }, "99": { "num_vectors": 12, "num_partitions": 4 }, "100": { "num_vectors": 37, "num_partitions": 1 }}
כדי לראות את מספר השורות שנוצרו בזמן יצירת האינדקס, מריצים את הפקודה הבאה:
SELECT * FROM pg_stat_ann_index_creation;
הפלט אמור להיראות כך:
-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid | 271236
indexrelid | 271242
schemaname | public
relname | t1
indexrelname | t1_ix1
index_rows_at_creation_time | 262144
למידע נוסף על הרשימה המלאה של המדדים, אפשר לעיין במאמר מדדים של אינדקס וקטורי.