לפני שמתחילים להשתמש בחיפוש וקטורי, צריך לבחור מודל הטמעה, להכין את הנתונים ולהחליט באיזה סוג של נקודת קצה להשתמש. בדף הזה מופיע מידע על הפעולות האלה.
הכנת ההטמעות
כדי להשתמש ב-Vector Search, צריך להכין את ההטמעות. אם כבר יש לכם הטמעות, דלגו אל בחירת נקודת קצה.
כדי ליצור את ההטמעות:
בחירת מודל להטמעה: יש הרבה מודלים חיצוניים להטמעה עם תכונות שונות.
התכונה Vector Search תומכת בהטמעות צפופות, בהטמעות דלילות ובחיפוש היברידי. חיפוש היברידי משתמש בהטמעות צפופות ודלילות בהתאם למשקל שאתם מציינים לסוגי ההטמעה האלה.
בהתאם לתרחיש השימוש, בוחרים אחד מסוגי המודלים הבאים:
מוכן לשימוש: אם רוצים להתאים טקסט לטקסט או טקסט לתמונות באופן סמנטי לפי הרלוונטיות של הטקסט או התמונה בלבד. זהו תרחיש שימוש סטנדרטי, ולכן לא צריך לאמן או לכוונן את המודל. AI גנרטיבי ב-Vertex AI היא אפשרות מומלצת לתרחיש השימוש הזה. AI גנרטיבי ב-Vertex AI משתמש במודלים של הטמעה צפופה.
מודל מותאם אישית להטמעות: אם רוצים להתאים על סמך נתונים משלכם או תרחיש שימוש ספציפי.
הכנת הנתונים: מנקים ומעבדים מראש את הנתונים כדי לוודא שהם בפורמט שאפשר להשתמש בו במודל ההטמעה.
אימון מודל ההטמעה אם משתמשים במודל בהתאמה אישית: אם בחרתם להשתמש במודל הטמעה בהתאמה אישית (שיפור), אתם צריכים לאמן אותו על הנתונים שלכם. זה יכול להיות תהליך ארוך, שתלוי בגודל ובמורכבות של הנתונים. אם אתם משתמשים במודל שעבר אימון מראש מתוך Model Garden, אתם יכולים לדלג על השלב הזה.
יצירת הטמעות: אחרי שהמודל עובר אימון, אפשר להשתמש בו כדי ליצור הטמעות של הנתונים.
בחירת נקודת קצה
אחרי שיוצרים את האינדקס, פורסים אותו בנקודת קצה. מידע נוסף זמין במאמרים פריסה וניהול של נקודות קצה של אינדקס ציבורי ופריסה וניהול של נקודות קצה של אינדקס ברשת VPC. מומלץ להחליט איזה סוג של נקודת קצה צריך לפני שיוצרים את האינדקס.
אפשר לפרוס את אינדקס השאילתות באחת מהאפשרויות הבאות:
נקודת קצה (endpoint) ציבורית: אם אתם פורסים לנקודת קצה ציבורית, אתם לא צריכים להגדיר את הרשת. ברשתות ציבוריות זמן האחזור מעט גבוה יותר, אבל ההגדרה שלהן מהירה יותר והתחזוקה שלהן קלה יותר.
נקודת קצה פרטית: אם רוצים להשתמש ב-VPC, צריך קודם להגדיר רשת. חיפוש וקטורי תומך בשני סוגים של רשתות פרטיות.
חיבור קישור בין רשתות VPC שכנות (peering) כדי להפחית את זמן האחזור ברשת.
חיבור שירות פרטי לשימוש פרטי בשירותים ברשתות VPC ששייכות לקבוצות, לצוותים, לפרויקטים או לארגונים שונים.
המאמרים הבאים
אחרי שיוצרים את ההטמעות ומחליטים איפה לפרוס את האינדקס, השלב הבא הוא להגדיר את האינדקס.
- איך מגדירים את הפורמט והמבנה של נתוני הקלט
- למד כיצד ליצור אינדקס של Vector Search באמצעות מדריכים ל-Notebook
- איך מנהלים אינדקסים