Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

שיטות מומלצות ליצירת אינדקסים של וקטורים

בדף הזה מפורטות שיטות מומלצות ליצירת אינדקסים של וקטורים, שיעזרו לכם לבצע אופטימיזציה של אינדקסים של וקטורים ולשפר את תוצאות השאילתות של חיפוש שכנים קרובים משוער (ANN).

שינוי אפשרויות החיפוש הווקטורי

הערכים האופטימליים ביותר לאפשרויות של אינדקס הווקטורים תלויים בתרחיש לדוגמה, במערך נתוני הווקטורים ובשאילתות הווקטורים. כדי להגדיר ולשנות את הערכים האלה, צריך ליצור אינדקס וקטורי חדש ולהגדיר את index_option_list בהצהרת CREATE VECTOR INDEX. יכול להיות שתצטרכו לבצע כוונון איטרטיבי כדי למצוא את הערכים הכי טובים לעומס העבודה הספציפי שלכם.

ריכזנו כאן כמה הנחיות שיעזרו לכם לבחור ערכים מתאימים:

‫tree_depth (רמת העץ): אם בטבלה שמוסיפים לאינדקס יש פחות מ-10 מיליון שורות, משתמשים ב-tree_depth של 2. אחרת, tree_depth של 3 תומך בטבלאות של עד כ-10 מיליארד שורות.
‫num_leaves: משתמשים בשורש הריבועי של מספר השורות במערך הנתונים. ערך גדול יותר יכול להגדיל את משך זמן של תהליך build של אינדקס הווקטורים. מומלץ להימנע מהגדרה של num_leaves גדול יותר מ-table_row_count חלקי 1,000, כי זה יוביל לעלים קטנים מדי ולביצועים נמוכים.
‫num_leaves_to_search: האפשרות הזו מציינת כמה צמתי עלים של האינדקס נסרקים. הגדלת הערך של num_leaves_to_search משפרת את ההחזרה אבל גם מגדילה את זמן האחזור והעלות. מומלץ להשתמש במספר שהוא 1% ממספר העלים הכולל שמוגדר בהצהרת CREATE VECTOR INDEX בתור הערך של num_leaves_to_search. אם משתמשים בסעיף של מסנן, צריך להגדיל את הערך הזה כדי להרחיב את החיפוש.

אם הושג דיוק מקובל, אבל עלות השאילתה גבוהה מדי, מה שמוביל למקסימום נמוך של QPS, נסו להגדיל את num_leaves באמצעות השלבים הבאים:

מגדירים את num_leaves ככפולה k של הערך המקורי (לדוגמה, 2 * sqrt(table_row_count)).
מגדירים את num_leaves_to_search כערך ששווה לערך המקורי שלו כפול k.
כדאי לנסות להקטין את num_leaves_to_search כדי לשפר את העלות ואת השאילתות לשנייה, תוך שמירה על ההחזרה.

שיפור יכולת השליפה מהזיכרון

כדי לשפר את ההיזכרות, כדאי לשנות את הערך של num_leaves_to_search או לבנות מחדש את אינדקס הווקטורים.

הגדלת הערך `num_leaves_to_search`

אם הערך של num_leaves_to_search קטן מדי, יכול להיות שיהיה לכם קשה יותר למצוא את השכנים הקרובים ביותר עבור חלק מהווקטורים של השאילתות. יצירת אינדקס וקטורי חדש עם ערך num_leaves_to_search גבוה יותר יכולה לעזור לשפר את ההחזרה על ידי חיפוש של יותר עלים. יכול להיות שהשאילתות האחרונות יכילו יותר וקטורים מאתגרים כאלה.

בנייה מחדש של אינדקס הווקטורים

מבנה העץ של אינדקס הווקטורים עובר אופטימיזציה בהתאם למערך הנתונים בזמן היצירה, והוא סטטי לאחר מכן. לכן, אם מוסיפים וקטורים שונים באופן משמעותי אחרי שיוצרים את אינדקס הווקטורים הראשוני, יכול להיות שמבנה העץ לא יהיה אופטימלי, מה שיוביל לזיכרון חלש יותר.

כדי לבנות מחדש את אינדקס הווקטורים ללא השבתה:

יוצרים אינדקס וקטורי חדש באותה עמודת הטמעה כמו האינדקס הווקטורי הנוכחי, ומעדכנים את הפרמטרים (לדוגמה, OPTIONS) לפי הצורך. אחרי שתיצור את האינדקס, כדאי לבדוק איזה מבין שני האינדקסים מניב ביצועים טובים יותר. אם כן, עוברים לשלב הבא. אחרת, ממשיכים למחיקת אינדקס הווקטורים הישן.
מערכת Spanner מחליטה באופן אוטומטי באיזה אינדקס להשתמש בהרצת השאילתה. ב-Spanner יש שתי דרכים לציין את האינדקס שבו רוצים להשתמש. בוחרים אחת מהשיטות הבאות כדי להעריך את המדדים ולהשוות ביניהם:

א. לשנות את הבקשה: אפשר לעדכן קבוצת משנה של השאילתות כך שישתמשו בהנחיית FORCE_INDEX כדי להפנות לאינדקס החדש ולעדכן את שאילתת החיפוש הווקטורי. כך מוודאים שהשאילתה משתמשת באינדקס הווקטורי החדש. יכול להיות שתצטרכו להשתמש בשיטה הזו כדי להגדיר מחדש את num_leaves_to_search בשאילתה החדשה.

ב. שינוי הסכימה: אפשר להגדיר את האפשרות disable_search באחד ממדדי הווקטורים. אם מגדירים את הערך true, מערכת Spanner משביתה את אינדקס הווקטורים. אפשר לעשות את זה על ידי הפעלת ההצהרה ALTER VECTOR INDEX schema change:
```
  ALTER VECTOR INDEX IncidentVectorIndex SET OPTIONS (disable_search=true);
```
השיטה הזו מונעת מ-Spanner להשתמש באינדקס הווקטורי הזה במסד הנתונים שלכם. אם יש לכם שני אינדקסים ואתם מגדירים את האפשרות הזו באינדקס הישן יותר, כל השאילתות ישתמשו באינדקס החדש אחרי שהשינוי בסכימה יחול. אם משתמשים ברמז FORCE_INDEX כדי לציין אינדקס וקטורי שהאפשרות disable_search שלו מוגדרת לערך true, השאילתה תיכשל.
מבטלים את האינדקס הווקטורי המיושן.

שיטות מומלצות ליצירת אינדקסים של וקטורים קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

שינוי אפשרויות החיפוש הווקטורי

שיפור יכולת השליפה מהזיכרון

הגדלת הערך num_leaves_to_search

בנייה מחדש של אינדקס הווקטורים

המאמרים הבאים

שיטות מומלצות ליצירת אינדקסים של וקטורים

הגדלת הערך `num_leaves_to_search`