Parallel Web Systems מציעה ממשק API לחיפוש שמאפשר גישה לנתונים באינטרנט שזמינים לציבור ועברו אופטימיזציה לשימוש במודלים גדולים של שפה לצורך עיגון. בדף הזה מוסבר איך להשתמש ב-Parallel כדי להקפיד על תשובות של Gemini.
עיגון עם Parallel ב-Vertex AI הוא מוצר נפרד (כפי שמוגדר ב Google Cloud ההסכם שלכם) שמקשר בין מודלים של Gemini לבין נתונים ציבוריים מהאינטרנט שמסופקים על ידי ממשק ה-API לחיפוש של Parallel Web Systems. השירות הזה מאפשר ל-Gemini לגשת למידע עדכני ממיליארדי דפי אינטרנט, כדי לספק תשובות עדכניות ועובדתיות יותר.
חשוב לשים לב: כדי להשתמש ב-Parallel, Google Cloud צריכה לשלוח נתוני לקוחות מסוימים למוצר הנפרד של Parallel לצורך עיבוד. השימוש בשירות Parallel כפוף לתנאים ולהגבלות הנפרדים של Parallel ולמדיניות השימוש המקובל של Parallel.
תרחישים לדוגמה
ההארקה באמצעות Parallel מתאימה לתרחישי שימוש כמו הבאים:
- שימוש בנתוני אתר למטרות השלמה או העשרה של מידע.
- סוכני AI מורכבים שנדרשים לחיפושים מעמיקים יותר באינטרנט כדי לענות על שאלות מורכבות יותר.
- פיתוח API שמשלב נתונים מחיפוש באינטרנט.
- עוזרים וירטואליים שפונים לעובדים ומאפשרים למשתמשי קצה לשאול שאלות וליצור דוחות מורכבים באמצעות המידע העדכני ביותר באינטרנט.
- אפליקציות שפונות לצרכנים, כמו קמעונאות ונסיעות, שמאפשרות למשתמש לקבל החלטות רכישה מושכלות.
- סוכנים אוטומטיים שפועלים באופן אוטונומי כדי לבצע משימות אוטומטיות, כמו ניתוח חדשות ובדיקות KYC.
- סוכנים אנכיים (סוכני מכירות, סוכני תכנות, סוכנים פיננסיים) מקבלים את ההקשר העדכני ביותר מהאינטרנט.
דוגמה
מי ניצח במירוץ הגרנד פרי של פורמולה 1 בלאס וגאס בשנת 2025?
| ללא נקודת התייחסות | עם הארקה |
|---|---|
| המירוץ של לאס וגאס בשנת 2025 עדיין לא התקיים. המירוץ מתוכנן להתקיים בסוף השבוע של 20-22 בנובמבר 2025. לכן, המנצח לא ידוע כרגע. | המנצח במירוץ הגרנד פרי פורמולה 1 בלאס וגאס בשנת 2025 היה מקס ורסטאפן מקבוצת רד בול רייסינג. המירוץ התקיים ב-22 בנובמבר 2025. מקורות: domain1.com, domain2.com, ... |
מודלים נתמכים
בקטע הזה מפורטים המודלים שתומכים בהארקה באמצעות חיפוש מקביל באינטרנט.
לפני שמתחילים
כדי להשתמש ב-Grounding עם Parallel, צריך לקבל מפתח API מהאתר של Parallel. מפתח ה-API הזה משמש בבקשה שלכם ל-Gemini.
הצגת תשובות של Gemini שמבוססות על נתונים מ-Parallel
כדי לבקש תשובות מבוססות מ-Gemini, משתמשים ב-API בארכיטקטורת REST לפי הדוגמה הבאה. כדי להשיג את הביצועים הטובים ביותר, מומלץ להשתמש בהגדרות ברירת המחדל לפרמטרים אופציונליים, אלא אם אתם צריכים ערכים שאינם ברירת המחדל.
REST
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- LOCATION: האזור שבו הבקשה תעובד. כדי להשתמש בנקודת הקצה הגלובלית, צריך להחריג את המיקום משם נקודת הקצה ולהגדיר את המיקום של המשאב כ-global.
- PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
- MODEL_ID: המזהה של המודל לשימוש.
- TEXT: הנחיית הטקסט לשליחה למודל.
- API_KEY: מפתח ה-API שלכם לחיפוש AI מקביל.
- EXCLUDE_DOMAINS: אופציונלי: רשימה של דומיינים שצריך להחריג ממקורות ההארקה. אם מציינים דומיינים, המערכת לא כוללת מקורות מהדומיינים האלה. הערכים הקבילים הם דומיינים (www.example.com) או סיומות של דומיינים שמתחילות בנקודה ( .gov, .edu, .co.uk). אפשר לציין עד 10 דומיינים.
- INCLUDE_DOMAINS: אופציונלי: רשימה של דומיינים שרוצים לכלול במקורות המידע. אם מציינים דומיינים, המקורות מהדומיינים האלה נכללים. הערכים הקבילים הם דומיינים (www.example.com) או סיומות של דומיינים שמתחילות בנקודה ( .gov, .edu, .co.uk). אפשר לציין עד 10 דומיינים.
- MAX_CHARS_PER_RESULT: אופציונלי: מספר התווים המקסימלי שייכלל בכל קטע מתוצאת החיפוש. אם לא מציינים ערך, ברירת המחדל היא
30000. הטווח המותר הוא[1000, 100000]. - MAX_CHARS_TOTAL: אופציונלי: המספר המקסימלי של התווים מכל קטעי המידע מתוצאות החיפוש. אם לא מציינים ערך, ברירת המחדל היא
100000. הטווח המותר הוא[1000, 1000000]. - MAX_RESULTS: אופציונלי: מספר תוצאות החיפוש המקסימלי שישמשו להארקה. אם לא מציינים ערך, ברירת המחדל היא
10. הטווח המותר הוא[1, 20].
ה-method של ה-HTTP וכתובת ה-URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
תוכן בקשת JSON:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
כדי לשלוח את הבקשה צריך להרחיב אחת מהאפשרויות הבאות:
אתם אמורים לקבל תגובת JSON שדומה לזו:
מכסה
מכסת ברירת המחדל היא 60 הנחיות בדקה. אם אתם צריכים להגדיל את מגבלות הקצב, אתם יכולים לפנות אל support@parallel.ai ואל צוות חשבון Google שלכם ולציין את תרחיש השימוש והדרישות שלכם.
חיוב
השימוש ב-Grounding עם Parallel כרוך בחיובים הבאים:
- צריכת אסימונים ב-Gemini: אסימוני הנחיה, אסימוני חשיבה ואסימוני פלט. מידע נוסף מפורט בקטע תמחור.
- התבססות של Gemini על הנתונים שלכם: מידע נוסף זמין במאמר בנושא תמחור.
- לא נגבה תשלום נוסף על טוקנים של קלט שסופקו על ידי Parallel.
- תמחור לשימוש ב-API של החיפוש של Parallel: מידע נוסף זמין בדף התמחור של Parallel.