בדף הזה מתועדת גרסה 17.5.0 של AlloyDB Omni באמצעות אפשרות הפריסה Linux. בוחרים אפשרות פריסה אחרת.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

שיפור הביצועים של שאילתות וקטוריות ב-AlloyDB Omni

בחירת גרסת תיעוד:

במאמר הזה מוסבר איך לשפר את הביצועים של השאילתות ואת יכולת האחזור ב-AlloyDB Omni באמצעות כוונון של האינדקסים.

לפני שמתחילים

לפני שיוצרים אינדקס ScaNN, צריך לבצע את הפעולות הבאות:

מוודאים שכבר נוצרה טבלה עם הנתונים.
כדי למנוע בעיות במהלך יצירת האינדקס, צריך לוודא שהערך שמוגדר לדגל maintenance_work_mem ולדגל shared_buffers נמוך מזיכרון המחשב הכולל.
כדי להשתמש באינדקסים עם ארבע רמות, קודם צריך להפעיל את תכונת התצוגה המקדימה במופע. כדי להפעיל את תכונת התצוגה המקדימה, בוחרים באחת משתי השיטות הבאות:
- מפעילים את דגל מסד הנתונים scann.enable_preview_features.
- מגדירים את הדגל scann.max_allowed_num_levels של מסד הנתונים ברמת הסשן לערך 3. sql SET scann.max_allowed_num_levels = 3;

כוונון של אינדקס `ScaNN`

ההנחיות הבאות יעזרו לכם לקבוע כמה רמות צריך להגדיר באינדקס ScaNN:

אם יש 0 עד 10 מיליון שורות: בוחרים אינדקס דו-רמתי.
ל-10 מיליון עד 100 מיליון שורות:
- כדי לתת עדיפות לאחזור תוצאות החיפוש, בוחרים אינדקס דו-רמתי.
- כדי לתת עדיפות למשך זמן של תהליך build של האינדקס, בוחרים באינדקס ברמה 3.
ל-100 מיליון עד מיליארד שורות:
- כדי לתת עדיפות לאחזור תוצאות החיפוש, בוחרים אינדקס עם שלוש רמות.
- כדי לתת עדיפות למשך זמן של תהליך build של האינדקס, בוחרים אינדקס ברמה 4 (בתצוגה מקדימה).
אם יש מיליארד עד 10 מיליארד שורות: בוחרים אינדקס ברמה 4 (בתצוגה מקדימה).

בדוגמאות הבאות מוצגים אינדקסים של ScaNN בשתי רמות, בשלוש רמות ובארבע רמות, שמראים איך מגדירים פרמטרים של כוונון לטבלה עם 1,000,000 שורות:

אינדקס דו-רמתי

SET LOCAL scann.num_leaves_to_search = 1;
SET LOCAL scann.pre_reordering_num_neighbors=50;

CREATE INDEX my-scann-index ON my-table
  USING scann (vector_column cosine)
  WITH (num_leaves = [power(1000000, 1/2)]);

אינדקס עם שלוש רמות

SET LOCAL scann.num_leaves_to_search = 10;
SET LOCAL scann.pre_reordering_num_neighbors=50;

CREATE INDEX my-scann-index ON my-table
  USING scann (vector_column cosine)
  WITH (num_leaves = [power(1000000, 2/3)], max_num_levels = 2);

אינדקס עם ארבע רמות

(בתצוגה מקדימה)

SET LOCAL scann.num_leaves_to_search = 100;
SET LOCAL scann.pre_reordering_num_neighbors=50;

CREATE INDEX my-scann-index ON my-table
  USING scann (vector_column cosine)
  WITH (num_leaves = [power(1000000, 3/4)], max_num_levels = 3);

טיפול בביטולים של DML בגלל האצה באמצעות מנוע מבוסס-עמודות

אם בחרתם להאיץ את החיפושים הווקטוריים באמצעות מנוע העמודות, חשוב לדעת שביטולים של DML ו-DDL בטבלאות הבסיס יכולים להשפיע על הביצועים של שאילתות וקטוריות. במקרה של תפוקת DML גבוהה, כדאי לשקול כוונון של הדגל google_columnar_engine.refresh_threshold_percentage במסד הנתונים או רענון ידני של האינדקס באמצעות הפקודה google_columnar_engine_refresh_index.

ניתוח השאילתות

כדי לנתח את התובנות לגבי השאילתה, משתמשים בפקודה EXPLAIN ANALYZE, כמו בדוגמה הבאה של שאילתת SQL.

  EXPLAIN ANALYZE SELECT result-column
  FROM my-table
  ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
  LIMIT 1;

תגובת הדוגמה QUERY PLAN כוללת מידע כמו הזמן שחלף, מספר השורות שנסרקו או הוחזרו והמשאבים שהיו בשימוש.

Limit  (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
  ->  Index Scan using my-scann-index on my-table  (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
        Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
        Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms

צפייה במדדים של אינדקס וקטורים

אתם יכולים להשתמש במדדים של אינדקס הווקטורים כדי לבדוק את הביצועים של אינדקס הווקטורים, לזהות תחומים שצריך לשפר ולשפר את האינדקס על סמך המדדים, אם צריך.

כדי לראות את כל המדדים של אינדקס הווקטורים, מריצים את שאילתת ה-SQL הבאה, שמשתמשת בתצוגה pg_stat_ann_indexes:

SELECT * FROM pg_stat_ann_indexes;

הפלט אמור להיראות כך:

-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid                  | 271236
indexrelid             | 271242
schemaname             | public
relname                | t1
indexrelname           | t1_ix1
indextype              | scann
indexconfig            | {num_leaves=100,max_num_levels=1,quantizer=SQ8}
indexsize              | 832 kB
indexscan              | 0
insertcount            | 250
deletecount            | 0
updatecount            | 0
partitioncount         | 100
distribution           | {"average": 3.54, "maximum": 37, "minimum": 0, "outliers": [37, 12, 11, 10, 10, 9, 9, 9, 9, 9]}
distributionpercentile |{"10": { "num_vectors": 0, "num_partitions": 0 }, "25": { "num_vectors": 0, "num_partitions": 30 }, "50": { "num_vectors": 3, "num_partitions": 30 }, "75": { "num_vectors": 5, "num_partitions": 19 }, "90": { "num_vectors": 7, "num_partitions": 11 }, "95": { "num_vectors": 9, "num_partitions": 5 }, "99": { "num_vectors": 12, "num_partitions": 4 }, "100": { "num_vectors": 37, "num_partitions": 1 }}

כדי לראות את מספר השורות שנוצרו בזמן יצירת האינדקס, מריצים את הפקודה הבאה:

SELECT * FROM pg_stat_ann_index_creation;