Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

יצירת הטבעות טקסט

התוסף google_ml_integration כולל פונקציות להטמעה בשני מרחבי שמות שונים: public ו-google_ml. בדף הזה מוסבר איך ליצור הטמעות של טקסט באמצעות פונקציות ממרחבי השמות האלה.

אפשר להשתמש בפונקציה embedding() בסכימה public עם כל מודל הטמעה של Gemini Enterprise Agent Platform בלי לרשום את נקודת הקצה. אם רוצים להעביר מידע מותאם אישית כמו סוג המשימה, צריך לרשום את נקודת הקצה ואז להשתמש בפונקציה google_ml.embedding() בסכימה google_ml. מידע נוסף על רישום נקודת קצה זמין במאמר רישום מודל.

איך הטמעות עובדות

דמיינו מסד נתונים שפועל ב-AlloyDB עם המאפיינים הבאים:

מסד הנתונים מכיל טבלה, items. כל שורה בטבלה הזו מתארת פריט שהעסק שלכם מוכר.
הטבלה items מכילה עמודה, complaints. בעמודה TEXT הזו מאוחסנות תלונות של קונים שנרשמו לגבי כל פריט.
המסד משולב עם Model Garden, ולכן יש לו גישה למודלים gemini-embedding-001 באנגלית.

למרות שבמסד הנתונים הזה מאוחסנות תלונות על פריטים, התלונות האלה מאוחסנות כטקסט פשוט, ולכן קשה לבצע עליהן שאילתות. לדוגמה, כדי לראות אילו פריטים קיבלו הכי הרבה תלונות מלקוחות שקיבלו את הצבע הלא נכון של המוצר, אפשר להריץ שאילתות SQL רגילות בטבלה, שמחפשות התאמות שונות למילות מפתח. עם זאת, הגישה הזו מתאימה רק לשורות שמכילות את מילות המפתח המדויקות האלה.

לדוגמה, שאילתת SQL בסיסית כמו SELECT * FROM item WHERE complaints LIKE "%wrong color%" לא תחזיר שורה שבה השדה complaints מכיל רק The picture shows a blue one, but the one I received was red.

שאילתות SQL שמבוססות על הטמעות שמופעלות על ידי LLM יכולות לעזור להחזיר תשובות דומות מבחינה סמנטית לשאילתות כאלה. באמצעות הטמעות, אפשר לשלוח שאילתה לטבלה בדוגמה הזו כדי למצוא פריטים שהתלונות עליהם דומות מבחינה סמנטית להנחיית טקסט נתונה, כמו It was the wrong color.

כדי ליצור הטמעה בסיסית, בוחרים אחת מהסכימות הבאות.

לפני שמתחילים

כדי לאפשר ל-AlloyDB ליצור הטמעות:

מתחברים למסד הנתונים באמצעות psql או AlloyDB for PostgreSQL Studio בתור משתמש postgres.
מוודאים שהתוסף google_ml_integration מותקן.

כדי לבדוק את גרסת התוסף באמצעות הפקודה הבאה:
```
SELECT extversion FROM pg_extension WHERE extname = 'google_ml_integration';
```
אם צריך לעדכן את התוסף, משתמשים בפקודה ALTER EXTENSION google_ml_integration UPDATE;.

הערה: אם אין לכם את ההרשאות הנדרשות, פנו לאדמין של מסד הנתונים כדי לבצע את העדכון. אפשרות אחרת היא לחכות עד שהגרסה החדשה תופעל באופן אוטומטי באשכול.
כדי ליצור הטמעות ממסד נתונים של AlloyDB, צריך להגדיר את AlloyDB כך שיפעל עם Agent Platform. מידע נוסף זמין במאמר בנושא שילוב מסד הנתונים עם פלטפורמת הנציגים.
נותנים הרשאות למשתמשי מסד הנתונים ליצור הטמעות.

אם אתם משתמשים ב-psql, צריך להתחבר למסד הנתונים שרוצים לתת לו הרשאות:
```
\c DB_NAME
GRANT EXECUTE ON FUNCTION embedding TO "USER_NAME";
```
מחליפים את מה שכתוב בשדות הבאים:
- ‫DB_NAME: שם מסד הנתונים שרוצים להעניק לו הרשאות.
- ‫USER_NAME: השם של המשתמש שרוצים להעניק לו הרשאות.
אם אתם משתמשים ב-AlloyDB for PostgreSQL Studio, בוחרים את שם מסד הנתונים שרוצים להעניק לו הרשאות ברשימה Database. מעניקים למשתמש את ההרשאה EXECUTE בפונקציה google_ml.embedding:
```
GRANT EXECUTE ON FUNCTION google_ml.embedding TO "USER_NAME";
```
מחליפים את USER_NAME בשם המשתמש שרוצים להעניק לו הרשאות.

יצירת הטמעות

משתמשים בפונקציית ה-SQL‏ google_ml.embedding() כדי להפעיל מודלים להטמעת טקסט.

כדי להפעיל את המודל וליצור הטמעות, מריצים את השאילתה הבאה:

SELECT
 google_ml.embedding(
   model_id => 'MODEL_ID',
   content => 'CONTENT');

מחליפים את מה שכתוב בשדות הבאים:

‫MODEL_ID: מזהה המודל המוסמך – לדוגמה, gemini-embedding-001.
‫CONTENT: הטקסט שרוצים לתרגם להטמעה וקטורית.

דוגמאות ליצירת הטמעות

בקטע הזה מופיעות כמה דוגמאות ליצירת הטמעות באמצעות נקודת קצה של מודל רשום.

מודלים של Gemini להטמעה

כדי ליצור הטמעות לנקודת קצה של מודל gemini-embedding-001 רשום, מריצים את ההצהרה הבאה:

   SELECT
     google_ml.embedding(
       model_id => 'gemini-embedding-001',
       content => 'AlloyDB is a managed, cloud-hosted SQL database service');

אם קלאסטר AlloyDB ונקודת הקצה של Gemini Enterprise Agent Platform נמצאים בפרויקטים שונים, צריך לבצע את השלבים הבאים:

מריצים את ההצהרה הבאה של CALL.

   CALL
     google_ml.create_model(
       model_id => 'gemini-embedding-001',
       model_request_url => 'https://REGION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION_ID/publishers/google/models/gemini-embedding-001:predict',
       model_provider => 'google',
       model_type => 'text_embedding',
       model_auth_type => 'alloydb_service_agent_iam',
       model_in_transform_fn => 'google_ml.vertexai_text_embedding_input_transform',
       model_out_transform_fn => 'google_ml.vertexai_text_embedding_output_transform'
     );

כדי ליצור הטמעות לנקודת קצה של מודל gemini-embedding-001 רשום, מריצים את ההצהרה הבאה:

  SELECT
    google_ml.embedding(
      model_id => 'gemini-embedding-001',
      content => 'AlloyDB is a managed, cloud-hosted SQL database service');

מודל הטמעה של OpenAI

כדי ליצור הטמעות עבור נקודת קצה של מודל text-embedding-ada-002 רשום של OpenAI, מריצים את ההצהרה הבאה:

   SELECT
     google_ml.embedding(
       model_id => 'text-embedding-ada-002',
       content => 'e-mail spam');

כדי ליצור הטמעות לנקודות קצה של מודלים רשומים text-embedding-3-small או text-embedding-3-large של OpenAI, מריצים את ההצהרה הבאה:

 SELECT
   google_ml.embedding(
     model_id => 'text-embedding-3-small',
     content => 'Vector embeddings in AI');