- ייצוג ב-JSON
- SnippetSpec
- SummarySpec
- ModelPromptSpec
- ModelSpec
- ExtractiveContentSpec
- SearchResultMode
- ChunkSpec
מפרט להגדרת אופן הפעולה של חיפוש התוכן.
| ייצוג ב-JSON |
|---|
{ "snippetSpec": { object ( |
| שדות | |
|---|---|
snippetSpec |
אם לא מציינים את |
summarySpec |
אם לא מציינים את |
extractiveContentSpec |
אם לא מספקים extractiveContentSpec, לא תהיה תשובה חילוצית בתגובת החיפוש. |
searchResultMode |
מציינת את מצב תוצאות החיפוש. אם לא מציינים מצב, ברירת המחדל של מצב תוצאות החיפוש היא |
chunkSpec |
מציין את מפרט החלק שיוחזר מתשובת החיפוש. האפשרות זמינה רק אם בשדה |
SnippetSpec
מפרט להגדרת תקצירים בתשובה לחיפוש.
| ייצוג ב-JSON |
|---|
{ "maxSnippetCount": integer, "referenceOnly": boolean, "returnSnippet": boolean } |
| שדות | |
|---|---|
maxSnippetCount |
[DEPRECATED] השדה הזה הוצא משימוש. כדי לשלוט בהחזרת קטע הקוד, משתמשים בשדה |
referenceOnly |
[DEPRECATED] השדה הזה הוצא משימוש ולא תהיה לו השפעה על קטע הקוד. |
returnSnippet |
אם |
SummarySpec
מפרט להגדרת סיכום שמוחזר בתגובה לחיפוש.
| ייצוג ב-JSON |
|---|
{ "summaryResultCount": integer, "includeCitations": boolean, "ignoreAdversarialQuery": boolean, "ignoreNonSummarySeekingQuery": boolean, "ignoreLowRelevantContent": boolean, "ignoreJailBreakingQuery": boolean, "modelPromptSpec": { object ( |
| שדות | |
|---|---|
summaryResultCount |
מספר התוצאות המובילות שמהן ייגזר הסיכום. אם מספר התוצאות שמוחזרות קטן מ- אפשר להשתמש ב-10 תוצאות לכל היותר במצב מסמכים, או ב-50 תוצאות במצב חלוקה לחלקים, כדי ליצור סיכום. משתמשים במצב chunks כשמגדירים את |
includeCitations |
מציין אם לכלול ציטוטים בסיכום. ערך ברירת המחדל הוא אם השדה הזה מוגדר לערך סיכום לדוגמה שכולל ציטוטים: BigQuery הוא מחסן נתונים (data warehouse) ארגוני מנוהל לחלוטין וללא שרתים של Google Cloud [1]. BigQuery תומך בכל סוגי הנתונים, פועל בענן ויש לו למידת מכונה מובנית ובינה עסקית, והכל בפלטפורמה מאוחדת [2, 3]. מספרי הציטוטים מתייחסים לתוצאות החיפוש שהוחזרו, והם מבוססים על אינדקס שמתחיל ב-1. לדוגמה, [1] מציין שהמשפט משויך לתוצאת החיפוש הראשונה. [2, 3] פירושו שהמשפט משויך לתוצאות החיפוש השנייה והשלישית. |
ignoreAdversarialQuery |
קובעת אם לסנן שאילתות שמנסות להערים על המערכת. ערך ברירת המחדל הוא Google משתמשת בסיווג של שאילתות חיפוש כדי לזהות שאילתות עוינות. אם שאילתת החיפוש מסווגת כשאילתה עוינת, לא מוחזר סיכום. לדוגמה, משתמש יכול לשאול שאלה לגבי תגובות שליליות על החברה או לשלוח שאילתה שמיועדת ליצירת פלט לא בטוח שמפר את המדיניות. אם השדה הזה מוגדר לערך |
ignoreNonSummarySeekingQuery |
קובעת אם לסנן שאילתות שלא מחפשות סיכום. ערך ברירת המחדל הוא Google משתמשת בסיווג של שאילתות חיפוש כדי לזהות שאילתות שמטרתן לקבל סיכום. אם שאילתת החיפוש מסווגת כשאילתה שלא מחפשת סיכום, לא מוחזר סיכום. לדוגמה, |
ignoreLowRelevantContent |
קובעת אם לסנן שאילתות עם רלוונטיות נמוכה. ערך ברירת המחדל הוא אם השדה הזה מוגדר לערך |
ignoreJailBreakingQuery |
זה שינוי אופציונלי. קובעת אם לסנן שאילתות שקשורות לפריצת מכשירים. ערך ברירת המחדל הוא Google משתמשת בסיווג של שאילתות חיפוש כדי לזהות שאילתות שקשורות לפריצת מכשירים. אם שאילתת החיפוש מסווגת כשאילתה שמטרתה לפרוץ את המודל, לא מוחזר סיכום. משתמש יכול להוסיף הנחיות לשאילתה כדי לשנות את הטון, הסגנון, השפה או התוכן של התשובה, או לבקש מהמודל להתנהג כישות אחרת, למשל: "תענה בטון של מנכ"ל חברה מתחרה". אם השדה הזה מוגדר לערך |
modelPromptSpec |
אם מציינים מפרט, הוא ישמש לשינוי ההנחיה שמועברת ל-LLM. |
languageCode |
קוד השפה של הסיכום. צריך להשתמש בתגי שפה שמוגדרים על ידי BCP47. הערה: זוהי תכונה ניסיונית. |
modelSpec |
אם מציינים מפרט, המערכת משתמשת בו כדי לשנות את מפרט המודל שמועבר ל-LLM. |
useSemanticChunks |
אם הערך הוא true, התשובה תיווצר מהחלקים הכי רלוונטיים מתוצאות החיפוש העליונות. התכונה הזו תשפר את איכות הסיכום. חשוב לזכור שאם התכונה הזו מופעלת, לא כל תוצאות החיפוש העליונות יצוטטו וייכללו ברשימת המקורות, ולכן אינדקס מקורות הציטוטים מצביע רק על תוצאות החיפוש שמופיעות ברשימת המקורות. |
ModelPromptSpec
המפרט של ההנחיה לשימוש עם המודל.
| ייצוג ב-JSON |
|---|
{ "preamble": string } |
| שדות | |
|---|---|
preamble |
טקסט בתחילת ההנחיה שמנחה את העוזר הדיגיטלי. דוגמאות זמינות במדריך למשתמש. |
ModelSpec
מפרט המודל.
| ייצוג ב-JSON |
|---|
{ "version": string } |
| שדות | |
|---|---|
version |
גרסת המודל ששימשה ליצירת הסיכום. הערכים הנתמכים הם:
|
ExtractiveContentSpec
מפרט להגדרת התוכן שחולץ בתשובה לשאילתת חיפוש.
| ייצוג ב-JSON |
|---|
{ "maxExtractiveAnswerCount": integer, "maxExtractiveSegmentCount": integer, "returnExtractiveSegmentScore": boolean, "numPreviousSegments": integer, "numNextSegments": integer } |
| שדות | |
|---|---|
maxExtractiveAnswerCount |
מספר התשובות המקסימלי שמופקות מתוך הטקסט ומוחזרות בכל תוצאת חיפוש. תשובה חילוצית היא תשובה מילולית שחולצה מהמסמך המקורי, ומספקת תשובה מדויקת ורלוונטית להקשר של שאילתת החיפוש. אם מספר התשובות התואמות קטן מ- לכל |
maxExtractiveSegmentCount |
המספר המקסימלי של פלחים שמוחזרים בכל תוצאת חיפוש. ההגדרה חלה רק אם קטע מידע חילוצי הוא קטע טקסט שחולץ מהמסמך המקורי, רלוונטי לשאילתת החיפוש, ובדרך כלל ארוך יותר מתשובה חילוצית. אפשר להשתמש בפלח כקלט למודלים מסוג LLM כדי ליצור סיכומים ותשובות. אם מספר הקטעים התואמים קטן מ- |
returnExtractiveSegmentScore |
מציינת אם להחזיר את ציון רמת הסמך מהפלחים שחולצו בכל תוצאת חיפוש. התכונה הזו זמינה רק למאגרי נתונים חדשים או למאגרי נתונים שנכללים ברשימת ההיתרים. כדי להוסיף את מאגר הנתונים לרשימת ההיתרים, צריך לפנות ל-Customer Engineer. ערך ברירת המחדל הוא |
numPreviousSegments |
מציינים אם לכלול גם את הפלחים הסמוכים לכל אחד מהפלחים שנבחרו. החזרת |
numNextSegments |
החזרת |
SearchResultMode
מציינת את מצב תוצאות החיפוש. אם לא מציינים מצב, ברירת המחדל של מצב תוצאות החיפוש היא DOCUMENTS.
| טיפוסים בני מנייה (enum) | |
|---|---|
SEARCH_RESULT_MODE_UNSPECIFIED |
ערך ברירת המחדל. |
DOCUMENTS |
החזרת מסמכים בתוצאת החיפוש. |
CHUNKS |
הפונקציה מחזירה נתחים בתוצאת החיפוש. האפשרות הזו זמינה רק אם מציינים את DocumentProcessingConfig.chunking_config. |
ChunkSpec
מציין את מפרט החלק שיוחזר מתשובת החיפוש. האפשרות זמינה רק אם בשדה SearchRequest.ContentSearchSpec.search_result_mode מגדירים את הערך CHUNKS
| ייצוג ב-JSON |
|---|
{ "numPreviousChunks": integer, "numNextChunks": integer } |
| שדות | |
|---|---|
numPreviousChunks |
מספר החלקים הקודמים שיוחזרו מהחלק הנוכחי. הערך המקסימלי המותר הוא 3. אם לא מציינים, לא יוחזרו נתונים קודמים. |
numNextChunks |
מספר החלקים הבאים שיוחזרו מהחלק הנוכחי. הערך המקסימלי המותר הוא 3. אם לא מציינים את הערך הזה, לא יוחזרו נתונים של מקטעים הבאים. |