‫RAG עם AI גנרטיבי ב-Cloud SQL

ליצור אפליקציית צ'אט עם AI גנרטיבי שמשתמשת ב-Retrieval-Augmented Generation (יצירה משולבת-אחזור, RAG) כדי לספק תשובות מדויקות שמבוססות על הנתונים של הארגון. במדריך הזה מוסבר על תבנית האפליקציה Generative AI RAG with Cloud SQL, שאפשר להתאים אותה לצרכים הייחודיים שלכם ולפרוס אותה כאפליקציה.

לדוגמה, אפשר להטמיע את התבנית הזו כדי לתת מענה לצרכים העסקיים הבאים:

דוגמה הצורך העסקי הטמעה
צ'אט בוט לתמיכת לקוחות חברות צריכות לספק תמיכה מיידית ללקוחות. אירוח ממשק הצ'אט ב-Cloud Run. ‫Vertex AI מעבד הטמעות ויוצר תשובות על סמך תיעוד טכני שמאוחסן כווקטורים ב-Cloud SQL.
עוזר פנימי לניהול משאבי אנוש העובדים צריכים למצוא מידע על הטבות, על מדיניות החברה ועל נהלים פנימיים. אירוח העוזר הדיגיטלי למשאבי אנוש ב-Cloud Run. כשעובדים שולחים שאילתות לכלי, Vertex AI מאחזר מידע רלוונטי על מדיניות מ-Cloud SQL כדי ליצור תשובות מדויקות שמבוססות על מקורות.
חוקר מסמכים משפטיים צוותים משפטיים צריכים למצוא במהירות תקדימים משפטיים רלוונטיים או סעיפים בחוזה במאגרי מסמכים גדולים. אירוח פורטל המחקר ב-Cloud Run. ‫Vertex AI מסכם תקדימים רלוונטיים ומזהה שפה ספציפית בחוזים באמצעות מסמכים משפטיים שמאוחסנים כווקטורים ב-Cloud SQL.
חיפוש סמנטי של מוצרים חברות מסחר אלקטרוני רוצות לאפשר חיפוש מוצרים באמצעות תיאורים בשפה טבעית ולא באמצעות מילות מפתח מדויקות. אירוח ממשק החיפוש ב-Cloud Run. מערכת Vertex AI מעבדת תיאורי משתמשים כדי להחזיר את המוצרים שהכי רלוונטיים מבחינה סמנטית מתוך קטלוגי מוצרים שמאוחסנים כווקטורים ב-Cloud SQL.

ארכיטקטורה

בתמונה הבאה מוצגים הרכיבים והחיבורים באפליקציה:

אפליקציית RAG של AI גנרטיבי באזור העיצוב. האפליקציה כוללת רכיבי frontend, אחזור, AI, ניהול סודות ומסד נתונים.

תהליך עיבוד הבקשה באפליקציה:

  1. טעינת נתונים למסד נתונים של PostgreSQL ב-Cloud SQL.
  2. Vertex AI יוצר הטבעות של שדות טקסט ומאחסן אותן כווקטורים במסד הנתונים.
  3. חלק קדמי של Cloud Load Balancing מקבל בקשות חיצוניות ומפיץ את התעבורה לקצה העורפי של Cloud Load Balancing.
  4. הקצה העורפי של Cloud Load Balancing מפזר את התעבורה לשירות הקצה הקדמי של Cloud Run.
  5. שירות הקצה הקדמי מתקשר עם שירות אחזור כדי לבצע קריאה ל-AI גנרטיבי.
  6. שירות האחזור משתמש ב-Secret Manager כדי לגשת בצורה מאובטחת למפתחות API ולפרטי כניסה שנדרשים לגישה ל-Vertex AI ול-Cloud SQL.
  7. שירות השליפה ממיר את הבקשה להטמעה ומחפש וקטורים דומים במסד הנתונים של Cloud SQL.
  8. שירות השליפה שולח תוצאות מהחיפוש, יחד עם ההנחיה המקורית, אל Vertex AI כדי ליצור תשובה.

המאמרים הבאים