Vertex AI מציע חבילה של ממשקי API שיעזרו לכם ליצור אפליקציות של Retrieval-Augmented Generation (יצירה משולבת-אחזור, RAG) או מנוע חיפוש. בדף הזה מוצגים ממשקי ה-API האלה.
אחזור ויצירה
RAG היא מתודולוגיה שמאפשרת למודלים גדולים של שפה (LLMs) ליצור תשובות שמבוססות על מקור הנתונים שתבחרו. יש שני שלבים ב-RAG:
- אחזור: קבלת העובדות הכי רלוונטיות במהירות יכולה להיות בעיה נפוצה בחיפוש. בעזרת RAG, אפשר לאחזר במהירות את העובדות שחשובות ליצירת תשובה.
- יצירה: העובדות שאוחזרו משמשות את ה-LLM ליצירת תשובה מבוססת.
Vertex AI מציע אפשרויות לשני השלבים כדי להתאים למגוון צרכים של מפתחים.
אחזור
בוחרים את שיטת השחזור שהכי מתאימה לצרכים שלכם:
חיפוש באמצעות סוכן: חיפוש באמצעות סוכן הוא מנוע לאחזור מידע באיכות של חיפוש Google, שיכול להיות רכיב בכל אפליקציית AI גנרטיבי שמשתמשת בנתונים של הארגון שלכם. חיפוש מבוסס סוכנים פועל כמנוע חיפוש סמנטי ומנוע חיפוש מילות מפתח מוכן לשימוש עבור RAG, עם יכולת לעבד מגוון סוגים של מסמכים ועם מחברים למגוון מערכות מקור, כולל BigQuery ומערכות רבות של צד שלישי.
מידע נוסף זמין במאמר בנושא חיפוש סוכנים.
יצירת אחזור משלכם: אם אתם רוצים ליצור חיפוש סמנטי, אתם יכולים להסתמך על ממשקי Vertex AI API לרכיבים של מערכת RAG מותאמת אישית. חבילת ממשקי ה-API הזו מספקת הטמעות באיכות גבוהה של ניתוח מסמכים, יצירת הטמעות, חיפוש וקטורי ודירוג סמנטי. השימוש בממשקי ה-API ברמה הנמוכה יותר מאפשר גמישות מלאה בתכנון רכיב המאחזר, ובמקביל מקצר את זמן יציאה לשוק ומספק איכות גבוהה באמצעות הסתמכות על ממשקי Vertex AI API ברמה נמוכה יותר.
מידע נוסף זמין במאמר בנושא יצירת דור מוגבר של אחזור (RAG).
שימוש באחזור קיים: אתם יכולים להשתמש בחיפוש הקיים שלכם ככלי אחזור ליצירה מבוססת-קרקע. אפשר גם להשתמש ב-RAG כדי להצמיד תשובות למקורות מידע, וכך לשדרג את החיפוש הקיים לאיכות גבוהה יותר. מידע נוסף זמין במאמר סקירה כללית על ביסוס.
Vertex AI RAG Engine: Vertex AI RAG Engine מספק זמן ריצה מנוהל במלואו לתיאום RAG, שמאפשר למפתחים לבנות RAG לשימוש בהקשרים של ייצור ומוכנות לארגונים.
מידע נוסף זמין במאמר סקירה כללית של Vertex AI RAG Engine בתיעוד בנושא AI גנרטיבי ב-Vertex AI.
חיפוש Google: כשמשתמשים ב-Grounding עם חיפוש Google עבור מודל Gemini, Gemini משתמש בחיפוש Google ויוצר פלט שמבוסס על תוצאות החיפוש הרלוונטיות. השיטה הזו לא דורשת ניהול, ומאפשרת לכם לגשת לידע העולמי שזמין ב-Gemini.
מידע נוסף זמין במאמר בנושא הארקה באמצעות חיפוש Google במסמכי התיעוד של AI גנרטיבי ב-Vertex AI.
יצירה
בוחרים את שיטת היצירה שהכי מתאימה לצרכים שלכם:
התבסס על הנתונים שלך: יצירת תשובות מבוססות לשאילתת משתמש. ממשק ה-API של יצירה מבוססת-קרקע משתמש במודלים מיוחדים של Gemini שעברו כוונון עדין, והוא דרך יעילה לצמצם הזיות ולספק תשובות שמבוססות על המקורות שלכם או על מקורות של צד שלישי, כולל הפניות לתוכן תמיכה בנושא יצירה מבוססת-קרקע.
מידע נוסף זמין במאמר בנושא יצירת תשובות שמבוססות על מקורות באמצעות RAG.
אפשר גם לעגן את התשובות לנתוני חיפוש מבוסס סוכנים באמצעות AI גנרטיבי ב-Vertex AI. מידע נוסף זמין במאמר התבססות על הנתונים.
עיגון באמצעות חיפוש Google: Gemini הוא המודל הכי מתקדם של Google, והוא מציע עיגון מוכן לשימוש בחיפוש Google. אתם יכולים להשתמש בו כדי לבנות פתרון מותאם אישית לחלוטין ליצירת תוכן מבוסס.
מידע נוסף זמין במאמר בנושא עיגון באמצעות חיפוש Google במסמכי התיעוד של AI גנרטיבי ב-Vertex AI.
Model Garden: אם אתם רוצים שליטה מלאה במודל שבחרתם, אתם יכולים להשתמש בכל אחד מהמודלים ב-Vertex AI Model Garden כדי ליצור תוכן.
יצירת Retrieval Augmented Generation משלכם
פיתוח מערכת RAG בהתאמה אישית להארקה מאפשר גמישות ושליטה בכל שלב בתהליך. Vertex AI מציע חבילה של ממשקי API שיעזרו לכם ליצור פתרונות חיפוש משלכם. השימוש בממשקי ה-API האלה מאפשר לכם גמישות מלאה בתכנון אפליקציית ה-RAG, ובמקביל מציע קיצור משמעותי של זמן יציאה לשוק ואיכות גבוהה, כי הוא מבוסס על ממשקי ה-API ברמה הנמוכה של Vertex AI.
הכלי Document AI Layout Parser. הכלי Document AI Layout Parser הופך מסמכים בפורמטים שונים לייצוגים מובְנים, וכך מאפשר גישה לתוכן כמו פסקאות, טבלאות, רשימות ורכיבים מבניים כמו כותרות, כותרות עליונות וכותרות תחתונות של דפים. הוא גם יוצר נתחים מודעים-הקשר שמקלים על אחזור מידע במגוון אפליקציות של AI גנרטיבי וגילוי.
מידע נוסף זמין במאמר בנושא Document AI Layout Parser במאמרי העזרה של Document AI.
Embeddings API: ממשקי ה-API של Vertex AI embeddings מאפשרים ליצור הטמעות של טקסט או של קלט מולטימודאלי. הטמעה היא וקטור של מספרים עם נקודה עשרונית שנועד לתעד את המשמעות של הקלט. אפשר להשתמש בהטמעות כדי להפעיל חיפוש סמנטי באמצעות חיפוש וקטורי.
מידע נוסף זמין במאמרים בנושא הטמעות של טקסט והטמעות מולטימודאליות במשאבי העזרה בנושא AI גנרטיבי ב-Vertex AI.
Vector Search. מנוע האחזור הוא חלק מרכזי באפליקציית ה-RAG או החיפוש שלכם. Vertex AI Vector Search הוא מנוע אחזור שיכול לחפש מיליארדי פריטים דומים או קשורים מבחינה סמנטית בקנה מידה גדול, עם מספר גבוה של שאילתות לשנייה (QPS), שיעור גבוה של אחזור מידע, חביון נמוך ויעילות בעלויות. הוא יכול לחפש הטמעות צפופות, ויש לו תמיכה בחיפוש מילות מפתח בהטמעה דלילה ובחיפוש היברידי בגרסת טרום-השקה ציבורית.
מידע נוסף מופיע במאמר סקירה כללית של Vertex AI Vector Search במסמכי Vertex AI.
ה-API של דירוג. ה-API לדירוג מקבל רשימה של מסמכים ומדרג אותם מחדש על סמך הרלוונטיות שלהם לשאילתה מסוימת. בהשוואה ל-embeddings שמתמקדים רק בדמיון הסמנטי בין מסמך לשאילתה, ה-API לדירוג יכול לתת לכם ציון מדויק יותר לגבי מידת ההתאמה של מסמך מסוים לשאילתה מסוימת.
מידע נוסף מופיע במאמר שיפור האיכות של חיפוש ושל RAG באמצעות API לדירוג.
The grounded generation API. משתמשים ב-API של יצירה שמבוססת על מקורות כדי ליצור תשובות שמבוססות על מקורות להנחיה של משתמש. מקורות העיגון יכולים להיות מאגרי נתונים של חיפוש מבוסס סוכנים, נתונים מותאמים אישית שאתם מספקים או חיפוש Google.
ממשק ה-API ליצירת תוכן. אפשר להשתמש ב-API ליצירת תוכן כדי ליצור תשובות מבוססות להנחיה של משתמש. מקורות העיגון יכולים להיות מאגרי נתונים של חיפוש מבוסס סוכנים או חיפוש Google.
מידע נוסף זמין במאמרים בנושא הארקה באמצעות חיפוש Google או הארקה באמצעות הנתונים שלכם.
ה-API לבדיקת ההארקה. ה-API לבדיקת ביסוס קובע עד כמה קטע טקסט מסוים מבוסס על קבוצה מסוימת של טקסטים להשוואה. ה-API יכול ליצור ציטוטים תומכים מטקסט ההפניה כדי לציין איפה הטקסט הנתון נתמך על ידי טקסט ההפניה. בין היתר, אפשר להשתמש ב-API כדי להעריך את מידת ההתבססות של תשובות ממערכות RAG. בנוסף, כחלק מתכונה ניסיונית, ה-API גם יוצר ציטוטים סותרים שמראים איפה הטקסט הנתון והטקסטים של ההפניות לא מסכימים.
מידע נוסף זמין במאמר בנושא בדיקת ההצמדה לקרקע.
תהליך עבודה: יצירת תשובות שמבוססות על מקורות מנתונים לא מובנים
זהו תרשים זרימה שמראה איך לשלב את ממשקי ה-API של Vertex AI RAG כדי ליצור תשובות מבוססות-קרקע מנתונים לא מובנים.
- מייבאים את המסמכים הלא מובנים, כמו קובצי PDF, קובצי HTML או תמונות עם טקסט, למיקום ב-Cloud Storage.
- מעבדים את המסמכים המיובאים באמצעות כלי הניתוח של הפריסה. כדי להפוך את התוכן הלא מובנה לייצוג מובנה, כלי הניתוח של הפריסה מפרק את המסמכים הלא מובנים לחלקים. מנתח הפריסה גם מחלץ הערות מהחלקים.
- יוצרים הטמעות טקסט לחלקים באמצעות Vertex AI text embeddings API.
- יצירת אינדקס ואחזור של הטמעות הצ'אנק באמצעות Vector Search.
- מדרגים את החלקים באמצעות ה-Ranking API וקובעים אילו חלקים מדורגים במקומות הראשונים.
- יצירת תשובות מבוססות על נתונים (grounded) על סמך נתחי הטקסט עם הדירוג הכי גבוה באמצעות Grounded Generation API או באמצעות Generate Content API.
אם יצרתם את התשובות באמצעות מודל ליצירת תשובות שאינו מודל של Google, אתם יכולים לבדוק את ההצמדה לקרקע של התשובות האלה באמצעות השיטה לבדיקת ההצמדה לקרקע.