מנוע ה-RAG של Vertex AI הוא רכיב של פלטפורמת Vertex AI, שמסייע ביצירה משולבת-אחזור (RAG). מנוע RAG מאפשר למודלים גדולים של שפה (LLM) לגשת לנתונים ממקורות ידע חיצוניים, כמו מסמכים ומסדי נתונים, ולשלב אותם. באמצעות RAG, מודלים גדולים של שפה (LLM) יכולים ליצור תשובות מדויקות ואינפורמטיביות יותר.
רשימת הפרמטרים
בקטע הזה מפורטים:
| פרמטרים | דוגמאות |
|---|---|
| פרמטרים לניהול מאגרים | דוגמאות לניהול קורפוס |
| פרמטרים לניהול קבצים | דוגמאות לניהול קבצים |
| פרמטרים לניהול פרויקטים | דוגמאות לניהול פרויקטים |
פרמטרים לניהול מאגר מידע
מידע על מאגר מידע של RAG זמין במאמר בנושא ניהול מאגרי מידע.
יצירת מאגר מידע של RAG
בטבלה הזו מפורטים הפרמטרים שמשמשים ליצירת מאגר מידע של RAG.
גוף הבקשה
| פרמטרים | |
|---|---|
|
חובה: השם המוצג של מאגר המידע של RAG. |
|
תיאור של מאגר המידע של RAG. |
|
אופציונלי: בלתי ניתן לשינוי: שם מפתח ה-CMEK משמש להצפנת נתונים במנוחה שקשורים למאגר המידע של RAG. שם המפתח רלוונטי רק לאפשרות פורמט: |
|
אופציונלי: בלתי ניתן לשינוי: ההגדרה של מסדי הנתונים הווקטוריים. |
|
ההגדרה של חיפוש מבוסס-Vertex AI. פורמט: |
vectorDbConfig
| פרמטרים | |
|---|---|
|
אם לא מציינים מסד נתונים וקטורי, |
|
מציינים את מופע Pinecone. |
|
זה השם שמשמש ליצירת אינדקס Pinecone שמשמש עם קורפוס RAG. אי אפשר לשנות את הערך הזה אחרי שהוא מוגדר. אפשר להשאיר אותו ריק ב |
|
מציינים את המכונה שלכם ב-Vertex Vector Search. |
|
זהו שם המשאב של אינדקס Vector Search שמשמש עם קורפוס RAG. פורמט: אי אפשר לשנות את הערך הזה אחרי שהוא מוגדר. אפשר להשאיר אותו ריק ב |
|
זהו שם המשאב של נקודת הקצה של אינדקס החיפוש הווקטורי שמשמשת עם מאגר המידע של RAG. פורמט: אי אפשר לשנות את הערך הזה אחרי שהוא מוגדר. אפשר להשאיר אותו ריק ב |
|
זהו שם המשאב המלא של הסוד שמאוחסן ב-Secret Manager, שכולל את מפתח Pinecone API. פורמט: אפשר להשאיר אותו ריק בקריאה ל-API |
|
אופציונלי: בלתי ניתן לשינוי: מודל ההטמעה שבו צריך להשתמש בשביל מאגר הידע של RAG. אי אפשר לשנות את הערך הזה אחרי שמגדירים אותו. אם לא תציינו מודל, נשתמש במודל text-embedding-005. |
עדכון מאגר מידע של RAG
בטבלה הזו מפורטים הפרמטרים שמשמשים לעדכון מאגר מידע של RAG.
גוף הבקשה
| פרמטרים | |
|---|---|
|
השם המוצג של מאגר המידע של RAG. |
|
תיאור של מאגר המידע של RAG. |
|
זה השם שמשמש ליצירת אינדקס Pinecone שמשמש עם קורפוס RAG. אם |
|
זהו שם המשאב של אינדקס Vector Search שמשמש עם קורפוס RAG. פורמט: אם |
|
זהו שם המשאב של נקודת הקצה של אינדקס החיפוש הווקטורי שמשמשת עם מאגר המידע של RAG. פורמט: אם |
|
שם המשאב המלא של הסוד שמאוחסן ב-Secret Manager, שכולל את מפתח ה-API של Pinecone. פורמט: |
הצגת רשימה של מאגרי מידע של RAG
בטבלה הזו מפורטים הפרמטרים שמשמשים לרישום של מאגרי מידע של RAG.
| פרמטרים | |
|---|---|
|
גודל הדף הרגיל ברשימה. |
|
טוקן הדף הרגיל של הרשימה. בדרך כלל מתקבל מ- |
קבלת קורפוס RAG
בטבלה הזו מפורטים הפרמטרים שמשמשים לקבלת מאגר מידע של RAG.
| פרמטרים | |
|---|---|
|
השם של משאב |
מחיקת מאגר מידע של RAG
בטבלה הזו מפורטים הפרמטרים שמשמשים למחיקת מאגר מידע של RAG.
| פרמטרים | |
|---|---|
|
השם של משאב |
פרמטרים של ניהול קבצים
מידע על קובץ RAG זמין במאמר בנושא ניהול קבצים.
העלאת קובץ RAG
בטבלה הזו מפורטים הפרמטרים שמשמשים להעלאת קובץ RAG.
גוף הבקשה
| פרמטרים | |
|---|---|
|
השם של משאב |
|
חובה: הקובץ להעלאה. |
|
חובה: ההגדרה של |
RagFile |
|
|---|---|
|
חובה: השם המוצג של קובץ ה-RAG. |
|
תיאור קובץ ה-RAG. |
UploadRagFileConfig |
|
|---|---|
|
מספר הטוקנים בכל מקטע. |
|
החפיפה בין המקטעים. |
ייבוא קובצי RAG
בטבלה הזו מפורטים הפרמטרים שמשמשים לייבוא של קובץ RAG.
| פרמטרים | |
|---|---|
|
חובה: השם של משאב פורמט: |
|
מיקום ב-Cloud Storage. תמיכה בייבוא של קבצים בודדים וגם של ספריות שלמות ב-Cloud Storage. |
|
URI של Cloud Storage שמכיל את קובץ ההעלאה. |
|
מיקום Google Drive. אפשר לייבא קבצים בודדים וגם תיקיות מ-Google Drive. |
|
ערוץ Slack שאליו הקובץ מועלה. |
|
שאילתת Jira שאליה הקובץ מועלה. |
|
מקורות SharePoint שאליהם הקובץ מועלה. |
|
מספר הטוקנים בכל מקטע. |
|
החפיפה בין המקטעים. |
|
מציינת את הגדרות הניתוח של אם השדה הזה לא מוגדר, RAG משתמש במנתח ברירת המחדל. |
|
המספר המקסימלי של שאילתות לדקה שהעבודה הזו יכולה לשלוח למודל ההטמעה שצוין בקורפוס. הערך הזה ספציפי למשימה הזו ולא משותף בין משימות ייבוא אחרות. כדי להגדיר ערך מתאים, אפשר לעיין בדף Quotas בפרויקט. אם לא צוין ערך, המערכת תשתמש בערך ברירת המחדל 1,000 QPM. |
GoogleDriveSource |
|
|---|---|
|
חובה: המזהה של המשאב ב-Google Drive. |
|
חובה: סוג המשאב ב-Google Drive. |
SlackSource |
|
|---|---|
|
חוזרת: פרטי ערוץ Slack, כולל מזהה וטווח זמן לייבוא. |
|
חובה: מזהה הערוץ ב-Slack. |
|
חותמת הזמן של ההתחלה של ההודעות לייבוא. |
|
חותמת הזמן של סיום ההודעות לייבוא. |
|
חובה: השם המלא של המשאב של הסוד שמאוחסן ב-Secret Manager, שמכיל אסימון גישה לערוץ Slack שיש לו גישה למזהי הערוצים ב-Slack.
פורמט: |
JiraSource |
|
|---|---|
|
חוזרת: רשימה של פרויקטים ב-Jira לייבוא בשלמותם. |
|
חוזרת: רשימה של שאילתות מותאמות אישית של Jira לייבוא. מידע על JQL (שפת שאילתות של Jira) זמין ב |
|
חובה: כתובת האימייל של Jira. |
|
חובה: URI של שרת Jira. |
|
חובה: שם המשאב המלא של הסוד שמאוחסן ב-Secret Manager,
שכולל את מפתח ה-API של Jira שיש לו גישה למזהי הערוצים של Slack.
פורמט: |
SharePointSources |
|
|---|---|
|
הנתיב של תיקיית SharePoint שממנה רוצים להוריד. |
|
המזהה של תיקיית SharePoint שממנה רוצים להוריד. |
|
השם של הכונן שממנו רוצים להוריד. |
|
המזהה של הכונן שממנו רוצים להוריד. |
|
מזהה האפליקציה שרשומה בפורטל Microsoft Azure.
|
|
חובה: השם המלא של המשאב של הסוד שמאוחסן ב-Secret Manager, שמכיל את הסוד של האפליקציה שרשומה ב-Azure. פורמט: |
|
מזהה ייחודי של מופע Azure Active Directory. |
|
שם אתר SharePoint שממנו רוצים להוריד. זה יכול להיות שם האתר או מזהה האתר. |
RagFileParsingConfig |
|
|---|---|
|
הכלי לניתוח פריסה שבו יש להשתמש עבור |
|
השם המלא של משאב של מעבד Document AI או גרסת מעבד. פורמט:
|
|
המספר המקסימלי של בקשות שהעבודה יכולה לשלוח למעבד Document AI בכל דקה. כדי להגדיר ערך מתאים כאן, אפשר לעיין במאמר בנושא מכסות ב-Document AI בכתובת https://cloud.google.com/document-ai/quotas ובדף Quota (מכסה) של הפרויקט. אם לא מציינים ערך, נעשה שימוש בערך ברירת המחדל של 120 QPM. |
|
המערכת לניתוח LLM שבה צריך להשתמש בשביל |
|
שם המשאב של מודל LLM. פורמט:
|
|
המספר המקסימלי של בקשות שהעבודה יכולה לשלוח למודל LLM בכל דקה. כדי להגדיר ערך מתאים לפרויקט, אפשר לעיין בקטע בנושא מכסות של מודלים ובדף Quota של הפרויקט. אם לא מציינים ערך, המערכת משתמשת בערך ברירת המחדל של 5,000 שאילתות לדקה. |
קבלת קובץ RAG
בטבלה הזו מפורטים הפרמטרים שמשמשים לקבלת קובץ RAG.
| פרמטרים | |
|---|---|
|
השם של משאב |
מחיקת קובץ RAG
בטבלה הזו מפורטים הפרמטרים שמשמשים למחיקת קובץ RAG.
| פרמטרים | |
|---|---|
|
השם של משאב |
פרמטרים של אחזור וחיזוי
בקטע הזה מפורטים הפרמטרים של השליפה והחיזוי.
פרמטרים של אחזור
בטבלה הזו מפורטים הפרמטרים של retrieveContexts API.
| פרמטרים | |
|---|---|
|
חובה: שם המשאב של המיקום לאחזור פורמט: |
|
מקור הנתונים של Vertex RagStore. |
|
חובה: שאילתת אחזור RAG יחידה. |
VertexRagStore
VertexRagStore |
|
|---|---|
|
רשימה: ייצוג של מקור RAG. אפשר להשתמש בו כדי לציין רק את הקורפוס או את |
|
פורמט: |
|
רשימה: רשימה של פורמט: |
RagQuery |
|
|---|---|
|
השאילתה בפורמט טקסט כדי לקבל הקשרים רלוונטיים. |
|
הגדרת האחזור של השאילתה. |
RagRetrievalConfig |
|
|---|---|
|
מספר ההקשרים לאחזור. |
|
הפונקציה מחזירה רק הקשרים עם מרחק וקטורי קטן יותר מהסף. |
|
הפונקציה מחזירה רק הקשרים עם דמיון וקטורי שגדול מהסף. |
|
שם הדגם של שירות הדירוג. לדוגמה: |
|
שם הדגם שמשמש לדירוג. לדוגמה: |
פרמטרים של חיזוי
בטבלה הזו מפורטים פרמטרים של תחזיות.
GenerateContentRequest |
|
|---|---|
|
הגדרה לשימוש במקור נתונים שמבוסס על מאגר RAG של Vertex AI. |
פרטים נוספים זמינים במאמר בנושא VertexRagStore.
פרמטרים של ניהול פרויקטים
בטבלה הזו מפורטים פרמטרים ברמת הפרויקט.
RagEngineConfig
| פרמטרים | |
|---|---|
RagManagedDbConfig.scaled |
המהדורה הזו מציעה ביצועים ברמת ייצור ופונקציונליות של התאמה אוטומטית לעומס. |
RagManagedDbConfig.basic |
במסלול הזה יש אפשרות חסכונית עם שימוש נמוך במחשוב. |
RagManagedDbConfig.unprovisioned |
בשלב הזה נמחקת התוכנית RagManagedDb ומופע Spanner הבסיסי שלה. |
דוגמאות לניהול מאגר מידע
בקטע הזה מופיעות דוגמאות לשימוש ב-API כדי לנהל את מאגר המידע של RAG.
יצירת דוגמה של מאגר מידע RAG
בדוגמאות הקוד האלה אפשר לראות איך ליצור מאגר מידע של RAG.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- CORPUS_DISPLAY_NAME: השם המוצג של מאגר המידע של RAG.
- CORPUS_DESCRIPTION: תיאור של מאגר המידע של RAG.
ה-method של ה-HTTP וכתובת ה-URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora
גוף בקשת JSON:
{
"display_name" : "CORPUS_DISPLAY_NAME",
"description": "CORPUS_DESCRIPTION",
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora"
Powershell
ב-CLI של gcloud.שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora" | Select-Object -Expand Content
צריך להתקבל קוד סטטוס של הצלחה (2xx).
בדוגמה הבאה מוסבר איך ליצור מאגר מידע של RAG באמצעות REST API.
// CreateRagCorpus
// Input: LOCATION, PROJECT_ID, CORPUS_DISPLAY_NAME
// Output: CreateRagCorpusOperationMetadata
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora \
-d '{
"display_name" : "CORPUS_DISPLAY_NAME"
}'
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
דוגמה לעדכון של מאגר מידע של RAG
אתם יכולים לעדכן את מאגר הנתונים של RAG עם שם תצוגה, תיאור ותצורת מסד נתונים וקטורי חדשים. עם זאת, אי אפשר לשנות את הפרמטרים הבאים במאגר המידע של RAG:
- סוג מסד הנתונים הווקטורי. לדוגמה, אי אפשר לשנות את מסד הנתונים הווקטורי מ-Weaviate ל-Vertex AI Feature Store.
- אם אתם משתמשים באפשרות של מסד נתונים מנוהל, אתם לא יכולים לעדכן את ההגדרות של מסד הנתונים הווקטורי.
בדוגמאות האלה אפשר לראות איך מעדכנים קורפוס RAG.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- CORPUS_ID: מזהה הקורפוס של קורפוס ה-RAG.
- CORPUS_DISPLAY_NAME: השם המוצג של מאגר המידע של RAG.
- CORPUS_DESCRIPTION: תיאור של מאגר המידע של RAG.
- INDEX_NAME: שם המשאב של אינדקס חיפוש וקטורי. פורמט:
projects/{project}/locations/{location}/indexes/{index}. - INDEX_ENDPOINT_NAME: שם המשאב של נקודת הקצה של אינדקס Vector Search. פורמט:
projects/{project}/locations/{location}/indexEndpoints/{index_endpoint}.
ה-method של ה-HTTP וכתובת ה-URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/CORPUS_ID
גוף בקשת JSON:
{
"display_name" : "CORPUS_DISPLAY_NAME",
"description": "CORPUS_DESCRIPTION",
"vector_db_config": {
"vertex_vector_search": {
"index": "INDEX_NAME",
"index_endpoint": "INDEX_ENDPOINT_NAME",
}
}
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
auth list
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/CORPUS_ID"
Powershell
ב-CLI של gcloud.שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/CORPUS_ID" | Select-Object -Expand Content
צריך להתקבל קוד סטטוס של הצלחה (2xx).
דוגמה להצגת רשימה של מאגרי מידע של RAG
בדוגמאות הקוד האלה אפשר לראות איך לרשום את כל מאגרי המידע של RAG.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- PAGE_SIZE: גודל הדף הסטנדרטי של הרשימה. אפשר לשנות את מספר המאגרי מידע של RAG שיוחזרו בכל דף על ידי עדכון הפרמטר
page_size. - PAGE_TOKEN: אסימון דף הרשימה הרגיל. הערך הזה מתקבל בדרך כלל באמצעות
ListRagCorporaResponse.next_page_tokenשל הקריאה הקודמת שלVertexRagDataService.ListRagCorpora.
ה-method של ה-HTTP וכתובת ה-URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora?page_size=PAGE_SIZE&page_token=PAGE_TOKEN
כדי לשלוח את הבקשה אתם צריכים לבחור אחת מהאפשרויות הבאות:
curl
ב-CLI של gcloud.מריצים את הפקודה הבאה:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora?page_size=PAGE_SIZE&page_token=PAGE_TOKEN"
Powershell
ב-CLI של gcloud.מריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora?page_size=PAGE_SIZE&page_token=PAGE_TOKEN" | Select-Object -Expand Content
אמור להתקבל קוד סטטוס של הצלחה (2xx) ורשימה של קורפוסים של RAG
במסגרת PROJECT_ID שצוין.
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
דוגמה לקורפוס RAG
בדוגמאות הקוד האלה אפשר לראות איך מקבלים קורפוס RAG.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- RAG_CORPUS_ID: המזהה של משאב מאגר המידע של RAG.
ה-method של ה-HTTP וכתובת ה-URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID
כדי לשלוח את הבקשה אתם צריכים לבחור אחת מהאפשרויות הבאות:
curl
ב-CLI של gcloud.מריצים את הפקודה הבאה:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID"
Powershell
ב-CLI של gcloud.מריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID" | Select-Object -Expand Content
תגובה מוצלחת מחזירה את משאב RagCorpus.
בדוגמה הבאה השתמשנו בפקודות get ו-list כדי להדגים איך RagCorpus משתמש בשדה rag_embedding_model_config בתוך vector_db_config, שמצביע על מודל ההטמעה שבחרתם.
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
RAG_CORPUS_ID: The corpus ID of your RAG corpus.
```
```sh
// GetRagCorpus
// Input: LOCATION, PROJECT_ID, RAG_CORPUS_ID
// Output: RagCorpus
curl -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID
// ListRagCorpora
curl -sS -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/
```
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
מחיקת דוגמה של מאגר מידע RAG
בדוגמאות הקוד האלה אפשר לראות איך מוחקים מאגר מידע של RAG.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- RAG_CORPUS_ID: המזהה של משאב
RagCorpus.
ה-method של ה-HTTP וכתובת ה-URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID
כדי לשלוח את הבקשה אתם צריכים לבחור אחת מהאפשרויות הבאות:
curl
ב-CLI של gcloud.מריצים את הפקודה הבאה:
curl -X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID"
Powershell
ב-CLI של gcloud.מריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method DELETE `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID" | Select-Object -Expand Content
תגובה מוצלחת מחזירה את DeleteOperationMetadata.
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
דוגמאות לניהול קבצים
בקטע הזה מופיעות דוגמאות לשימוש ב-API לניהול קבצי RAG.
העלאה של קובץ RAG לדוגמה
בדוגמאות הקוד האלה אפשר לראות איך מעלים קובץ RAG.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- RAG_CORPUS_ID: מזהה הקורפוס של קורפוס ה-RAG.
- LOCAL_FILE_PATH: הנתיב המקומי לקובץ שרוצים להעלות.
- DISPLAY_NAME: השם המוצג של קובץ ה-RAG.
- DESCRIPTION: תיאור קובץ ה-RAG.
כדי לשלוח את הבקשה, משתמשים בפקודה הבאה:
curl -X POST \
-H "X-Goog-Upload-Protocol: multipart" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-F metadata="{'rag_file': {'display_name':' DISPLAY_NAME', 'description':'DESCRIPTION'}}" \
-F file=@LOCAL_FILE_PATH \
"https://LOCATION-aiplatform.googleapis.com/upload/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:upload"
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
דוגמה לייבוא קובצי RAG
אפשר לייבא קבצים ותיקיות מ-Drive או מ-Cloud Storage. אפשר להשתמש ב-response.metadata כדי לראות כשלים חלקיים, זמן בקשה וזמן תגובה באובייקט response של ה-SDK.
הערך response.skipped_rag_files_count מתייחס למספר הקבצים שהמערכת דילגה עליהם במהלך הייבוא. קובץ ידלג אם התנאים הבאים יתקיימו:
- הקובץ כבר יובא.
- הקובץ לא השתנה.
- ההגדרה של חלוקת הקובץ לחלקים לא השתנתה.
Python
from vertexai import rag
import vertexai
# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# corpus_name = "projects/{PROJECT_ID}/locations/us-central1/ragCorpora/{rag_corpus_id}"
# paths = ["https://drive.google.com/file/123", "gs://my_bucket/my_files_dir"] # Supports Cloud Storage and Google Drive Links
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location="us-central1")
response = rag.import_files(
corpus_name=corpus_name,
paths=paths,
transformation_config=rag.TransformationConfig(
rag.ChunkingConfig(chunk_size=1024, chunk_overlap=256)
),
import_result_sink="gs://sample-existing-folder/sample_import_result_unique.ndjson", # Optional: This must be an existing Cloud Storage bucket folder, and the filename must be unique (non-existent).
llm_parser=rag.LlmParserConfig(
model_name="gemini-2.5-pro-preview-05-06",
max_parsing_requests_per_min=100,
), # Optional
max_embedding_requests_per_min=900, # Optional
)
print(f"Imported {response.imported_rag_files_count} files.")
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- RAG_CORPUS_ID: מזהה הקורפוס של קורפוס ה-RAG.
- FOLDER_RESOURCE_ID: מזהה המשאב של תיקיית Drive.
- GCS_URIS: רשימה של מיקומי Cloud Storage.
לדוגמה:
gs://my-bucket1. - CHUNK_SIZE: מספר הטוקנים שצריך להיות בכל נתח.
- CHUNK_OVERLAP: מספר האסימונים שחופפים בין חתיכות.
- EMBEDDING_MODEL_QPM_RATE: קצב השאילתות לדקה (QPM) שמשמש להגבלת הגישה של RAG למודל ההטמעה. דוגמה: 1,000.
ה-method של ה-HTTP וכתובת ה-URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:import
גוף בקשת JSON:
{
"import_rag_files_config": {
"gcs_source": {
"uris": "GCS_URIS"
},
"rag_file_chunking_config": {
"chunk_size": "CHUNK_SIZE",
"chunk_overlap": "CHUNK_OVERLAP"
}
}
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
ב-CLI של gcloud.שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:import"
Powershell
ב-CLI של gcloud.שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:import" | Select-Object -Expand Content
תגובה מוצלחת מחזירה את משאב ImportRagFilesOperationMetadata.
בדוגמה הבאה אפשר לראות איך מייבאים קובץ מ-Cloud Storage. משתמשים בשדה הבקרה max_embedding_requests_per_min כדי להגביל את הקצב שבו RAG Engine קורא למודל ההטמעה במהלך תהליך יצירת האינדקס ImportRagFiles. ערך ברירת המחדל של השדה הוא 1000 שיחות לדקה.
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- RAG_CORPUS_ID: מזהה הקורפוס של קורפוס ה-RAG.
- GCS_URIS: רשימה של מיקומי Cloud Storage.
לדוגמה:
gs://my-bucket1. - CHUNK_SIZE: מספר הטוקנים שצריך להיות בכל נתח.
- CHUNK_OVERLAP: מספר האסימונים שחופפים בין חתיכות.
- EMBEDDING_MODEL_QPM_RATE: קצב השאילתות לדקה (QPM) להגבלת הגישה של RAG למודל ההטמעה. דוגמה: 1,000.
// ImportRagFiles
// Import a single Cloud Storage file or all files in a Cloud Storage bucket.
// Input: LOCATION, PROJECT_ID, RAG_CORPUS_ID, GCS_URIS
// Output: ImportRagFilesOperationMetadataNumber
// Use ListRagFiles to find the server-generated rag_file_id.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:import \
-d '{
"import_rag_files_config": {
"gcs_source": {
"uris": "GCS_URIS"
},
"rag_file_chunking_config": {
"chunk_size": CHUNK_SIZE,
"chunk_overlap": CHUNK_OVERLAP
},
"max_embedding_requests_per_min": EMBEDDING_MODEL_QPM_RATE
}
}'
הדוגמה הבאה מדגימה איך מייבאים קובץ מ-Drive. משתמשים בשדה הבקרה max_embedding_requests_per_min כדי להגביל את הקצב שבו RAG Engine קורא למודל ההטמעה במהלך ImportRagFiles תהליך יצירת האינדקס. ערך ברירת המחדל של השדה הוא 1000 שיחות לדקה.
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- RAG_CORPUS_ID: מזהה הקורפוס של קורפוס ה-RAG.
- FOLDER_RESOURCE_ID: מזהה המשאב של תיקיית Drive.
- CHUNK_SIZE: מספר הטוקנים שצריך להיות בכל נתח.
- CHUNK_OVERLAP: מספר האסימונים שחופפים בין חתיכות.
- EMBEDDING_MODEL_QPM_RATE: קצב השאילתות לדקה (QPM) שמשמש להגבלת הגישה של RAG למודל ההטמעה. דוגמה: 1,000.
// ImportRagFiles
// Import all files in a Google Drive folder.
// Input: LOCATION, PROJECT_ID, RAG_CORPUS_ID, FOLDER_RESOURCE_ID
// Output: ImportRagFilesOperationMetadataNumber
// Use ListRagFiles to find the server-generated rag_file_id.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:import \
-d '{
"import_rag_files_config": {
"google_drive_source": {
"resource_ids": {
"resource_id": "FOLDER_RESOURCE_ID",
"resource_type": "RESOURCE_TYPE_FOLDER"
}
},
"max_embedding_requests_per_min": EMBEDDING_MODEL_QPM_RATE
}
}'
דוגמה לרשימת קובצי RAG
בדוגמאות הקוד האלה אפשר לראות איך מציגים רשימה של קובצי RAG.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- RAG_CORPUS_ID: המזהה של משאב
RagCorpus. - PAGE_SIZE: גודל הדף הסטנדרטי של הרשימה. אפשר לשנות את מספר
RagFilesשמוחזרים בכל דף על ידי עדכון הפרמטר page_size. - PAGE_TOKEN: אסימון דף הרשימה הרגיל. הערך הזה מתקבל באמצעות
ListRagFilesResponse.next_page_tokenשל הקריאה הקודמת שלVertexRagDataService.ListRagFiles.
ה-method של ה-HTTP וכתובת ה-URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles?page_size=PAGE_SIZE&page_token=PAGE_TOKEN
כדי לשלוח את הבקשה אתם צריכים לבחור אחת מהאפשרויות הבאות:
curl
ב-CLI של gcloud.מריצים את הפקודה הבאה:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles?page_size=PAGE_SIZE&page_token=PAGE_TOKEN"
Powershell
ב-CLI של gcloud.מריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles?page_size=PAGE_SIZE&page_token=PAGE_TOKEN" | Select-Object -Expand Content
אמור להתקבל קוד סטטוס של הצלחה (2xx) יחד עם רשימה של RagFiles במסגרת RAG_CORPUS_ID שצוין.
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
דוגמה לקובץ RAG
בדוגמאות הקוד האלה אפשר לראות איך מקבלים קובץ RAG.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- RAG_CORPUS_ID: המזהה של משאב
RagCorpus. - RAG_FILE_ID: המזהה של משאב
RagFile.
ה-method של ה-HTTP וכתובת ה-URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID
כדי לשלוח את הבקשה אתם צריכים לבחור אחת מהאפשרויות הבאות:
curl
ב-CLI של gcloud.מריצים את הפקודה הבאה:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID"
Powershell
ב-CLI של gcloud.מריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID" | Select-Object -Expand Content
תגובה מוצלחת מחזירה את משאב RagFile.
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
מחיקת קובץ RAG לדוגמה
בדוגמאות הקוד האלה אפשר לראות איך מוחקים קובץ RAG.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID>: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- RAG_CORPUS_ID: המזהה של משאב ה-RagCorpus.
- RAG_FILE_ID: המזהה של משאב ה-RagFile. פורמט:
projects/{project}/locations/{location}/ragCorpora/{rag_corpus}/ragFiles/{rag_file_id}.
ה-method של ה-HTTP וכתובת ה-URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID
כדי לשלוח את הבקשה אתם צריכים לבחור אחת מהאפשרויות הבאות:
curl
ב-CLI של gcloud.מריצים את הפקודה הבאה:
curl -X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID"
Powershell
ב-CLI של gcloud.מריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method DELETE `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID" | Select-Object -Expand Content
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
דוגמה לשאילתת אחזור
כשמשתמש שואל שאלה או מספק הנחיה, רכיב האחזור ב-RAG מחפש במאגר הידע שלו מידע שרלוונטי לשאילתה.
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- RAG_CORPUS_RESOURCE: השם של
RagCorpusהמשאב. פורמט:projects/{project}/locations/{location}/ragCorpora/{rag_corpus} - VECTOR_DISTANCE_THRESHOLD: רק הקשרים עם מרחק וקטורי קטן יותר מהסף מוחזרים.
- TEXT: טקסט השאילתה כדי לקבל הקשרים רלוונטיים.
- SIMILARITY_TOP_K: מספר ההקשרים המובילים לאחזור.
ה-method של ה-HTTP וכתובת ה-URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION:retrieveContexts
תוכן בקשת JSON:
{
"vertex_rag_store": {
"rag_resources": {
"rag_corpus": "RAG_CORPUS_RESOURCE"
},
"vector_distance_threshold": VECTOR_DISTANCE_THRESHOLD
},
"query": {
"text": TEXT
"similarity_top_k": SIMILARITY_TOP_K
}
}
curl
ב-CLI של gcloud.שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION:retrieveContexts"
Powershell
ב-CLI של gcloud.שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION:retrieveContexts" | Select-Object -Expand Content
אמור להתקבל קוד סטטוס של הצלחה (2xx) ורשימה של RagFiles קשורים.
דוגמה ליצירה
ה-LLM יוצר תשובה שמבוססת על מקורות באמצעות ההקשרים שאוחזרו.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה תעובד.
- MODEL_ID: מודל LLM ליצירת תוכן. לדוגמה:
gemini-2.5-flash. - GENERATION_METHOD: שיטה של מודל שפה גדול (LLM) ליצירת תוכן.
אפשרויות:
generateContent,streamGenerateContent. - INPUT_PROMPT: הטקסט שנשלח למודל שפה גדול (LLM) ליצירת תוכן. כדאי לנסות להשתמש בהנחיה שרלוונטית לקובצי ה-RAG שהועלו.
- RAG_CORPUS_RESOURCE: השם של
RagCorpusהמשאב. פורמט:projects/{project}/locations/{location}/ragCorpora/{rag_corpus} - SIMILARITY_TOP_K: אופציונלי: מספר ההקשרים העליונים לאחזור.
- VECTOR_DISTANCE_THRESHOLD: אופציונלי: מוחזרים הקשרים עם מרחק וקטורי קטן יותר מערך הסף.
- USER: שם המשתמש שלכם.
ה-method של ה-HTTP וכתובת ה-URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:GENERATION_METHOD
גוף בקשת JSON:
{
"contents": {
"role": "USER",
"parts": {
"text": "INPUT_PROMPT"
}
},
"tools": {
"retrieval": {
"disable_attribution": false,
"vertex_rag_store": {
"rag_resources": {
"rag_corpus": "RAG_CORPUS_RESOURCE"
},
"similarity_top_k": "SIMILARITY_TOP_K",
"vector_distance_threshold": VECTOR_DISTANCE_THRESHOLD
}
}
}
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
ב-CLI של gcloud.שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:GENERATION_METHOD"
Powershell
ב-CLI של gcloud.שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:GENERATION_METHOD" | Select-Object -Expand Content
תשובה מוצלחת מחזירה את התוכן שנוצר עם ציטוטים.
Python
במאמר התקנת Vertex AI SDK ל-Python מוסבר איך להתקין או לעדכן את Vertex AI SDK ל-Python. מידע נוסף מופיע ב מאמרי העזרה של Python API.
דוגמאות לניהול פרויקטים
המסלול הוא הגדרה ברמת הפרויקט שזמינה בקטע RagEngineConfigresource ומשפיעה על מאגרי מידע של RAG באמצעות RagManagedDb. כדי לקבל את הגדרת הרמה, משתמשים בפקודה GetRagEngineConfig. כדי לעדכן את הגדרות הרמה, משתמשים בפקודה UpdateRagEngineConfig.
מידע נוסף על ניהול הגדרות הרמה זמין במאמר ניהול רמות.
אחזור של הגדרות הפרויקט
בדוגמאות הקוד הבאות אפשר לראות איך לקרוא את RagEngineConfig:
המסוף
- נכנסים לדף RAG Engine במסוף Google Cloud .
- בוחרים את האזור שבו מנוע ה-RAG פועל. רשימת מאגרי המידע של RAG עודכנה.
- לוחצים על Configure RAG Engine (הגדרת מנוע RAG). מופיעה החלונית Configure RAG Engine. תוכלו לראות את הרמה שנבחרה למנוע ה-RAG.
- לוחצים על ביטול.
Python
from vertexai import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config = rag.rag_data.get_rag_engine_config(
name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
)
print(rag_engine_config)
REST
curl -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/ragEngineConfig
עדכון הגדרות הפרויקט
בקטע הזה מוצגות דוגמאות קוד שמדגימות איך לשנות את ההגדרה למסלול Scaled, Basic או Unprovisioned.
עדכון של RagEngineConfig לרמת Scaled
בדוגמאות הקוד הבאות אפשר לראות איך מגדירים את RagEngineConfig לרמה Scaled:
המסוף
- נכנסים לדף RAG Engine במסוף Google Cloud .
- בוחרים את האזור שבו מנוע ה-RAG פועל. רשימת מאגרי המידע של RAG עודכנה.
- לוחצים על Configure RAG Engine (הגדרת מנוע RAG). מופיעה החלונית Configure RAG Engine.
- בוחרים את הרמה שבה רוצים להפעיל את מנוע ה-RAG.
- לוחצים על Save.
Python
from vertexai import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(tier=rag.Scaled()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
REST
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/ragEngineConfig -d "{'ragManagedDbConfig': {'scaled': {}}}"
עדכון של RagEngineConfig לחבילת Basic
בדוגמאות הקוד הבאות אפשר לראות איך מגדירים את RagEngineConfig לרמה הבסיסית:
המסוף
- נכנסים לדף RAG Engine במסוף Google Cloud .
- בוחרים את האזור שבו מנוע ה-RAG פועל. רשימת מאגרי המידע של RAG עודכנה.
- לוחצים על Configure RAG Engine (הגדרת מנוע RAG). מופיעה החלונית Configure RAG Engine.
- בוחרים את הרמה שבה רוצים להפעיל את מנוע ה-RAG.
- לוחצים על Save.
Python
from vertexai import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(tier=rag.Basic()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
REST
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/ragEngineConfig -d "{'ragManagedDbConfig': {'basic': {}}}"
עדכון המינוי ל-RagEngineConfig למהדורה שלא הוקצתה
בדוגמאות הקוד הבאות אפשר לראות איך מגדירים את RagEngineConfig לרמה Unprovisioned:
המסוף
- נכנסים לדף RAG Engine במסוף Google Cloud .
- בוחרים את האזור שבו מנוע ה-RAG פועל. רשימת מאגרי המידע של RAG עודכנה.
- לוחצים על Configure RAG Engine (הגדרת מנוע RAG). מופיעה החלונית Configure RAG Engine.
- לוחצים על מחיקת מנוע RAG. מופיעה תיבת דו-שיח לאישור.
- כדי לוודא שאתם עומדים למחוק את הנתונים במנוע RAG, מקלידים delete ולוחצים על Confirm.
- לוחצים על Save.
Python
from vertexai import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(tier=rag.Unprovisioned()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
REST
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/ragEngineConfig -d "{'ragManagedDbConfig': {'unprovisioned': {}}}"
המאמרים הבאים
- מידע נוסף על מודלים נתמכים של יצירה זמין במאמר בנושא מודלים של AI גנרטיבי שתומכים ב-RAG.
- מידע נוסף על מודלים מוטמעים נתמכים זמין במאמר מודלים להטמעה.
- מידע נוסף על מודלים פתוחים זמין במאמר מודלים פתוחים.
- מידע נוסף על RAG Engine זמין במאמר סקירה כללית על RAG Engine.