ContentSearchSpec

מפרט להגדרת אופן הפעולה של חיפוש התוכן.

ייצוג ב-JSON
{
  "snippetSpec": {
    object (SnippetSpec)
  },
  "summarySpec": {
    object (SummarySpec)
  },
  "extractiveContentSpec": {
    object (ExtractiveContentSpec)
  },
  "searchResultMode": enum (SearchResultMode),
  "chunkSpec": {
    object (ChunkSpec)
  }
}
שדות
snippetSpec

object (SnippetSpec)

אם לא מציינים את snippetSpec, התקצירים לא נכללים בתשובת החיפוש.

summarySpec

object (SummarySpec)

אם לא מציינים את summarySpec, הסיכומים לא נכללים בתגובת החיפוש.

extractiveContentSpec

object (ExtractiveContentSpec)

אם לא מספקים extractiveContentSpec, לא תהיה תשובה חילוצית בתגובת החיפוש.

searchResultMode

enum (SearchResultMode)

מציינת את מצב תוצאות החיפוש. אם לא מציינים מצב, ברירת המחדל של מצב תוצאות החיפוש היא DOCUMENTS.

chunkSpec

object (ChunkSpec)

מציין את מפרט החלק שיוחזר מתשובת החיפוש. האפשרות זמינה רק אם בשדה SearchRequest.ContentSearchSpec.search_result_mode מגדירים את הערך CHUNKS

SnippetSpec

מפרט להגדרת תקצירים בתשובה לחיפוש.

ייצוג ב-JSON
{
  "maxSnippetCount": integer,
  "referenceOnly": boolean,
  "returnSnippet": boolean
}
שדות
maxSnippetCount
(deprecated)

integer

‫[DEPRECATED] השדה הזה הוצא משימוש. כדי לשלוט בהחזרת קטע הקוד, משתמשים בשדה returnSnippet. כדי לשמור על תאימות לגרסאות קודמות, נחזיר תקציר אם maxSnippetCount > 0.

referenceOnly
(deprecated)

boolean

‫[DEPRECATED] השדה הזה הוצא משימוש ולא תהיה לו השפעה על קטע הקוד.

returnSnippet

boolean

אם true, מחזירה קטע. אם אי אפשר ליצור תקציר, אנחנו מחזירים את ההודעה 'אין תקציר זמין לדף הזה'. גם snippetStatus עם SUCCESS או NO_SNIPPET_AVAILABLE יוחזרו.

SummarySpec

מפרט להגדרת סיכום שמוחזר בתגובה לחיפוש.

ייצוג ב-JSON
{
  "summaryResultCount": integer,
  "includeCitations": boolean,
  "ignoreAdversarialQuery": boolean,
  "ignoreNonSummarySeekingQuery": boolean,
  "ignoreLowRelevantContent": boolean,
  "ignoreJailBreakingQuery": boolean,
  "modelPromptSpec": {
    object (ModelPromptSpec)
  },
  "languageCode": string,
  "modelSpec": {
    object (ModelSpec)
  },
  "useSemanticChunks": boolean
}
שדות
summaryResultCount

integer

מספר התוצאות המובילות שמהן ייגזר הסיכום. אם מספר התוצאות שמוחזרות קטן מ-summaryResultCount, הסיכום נוצר מכל התוצאות.

אפשר להשתמש ב-10 תוצאות לכל היותר במצב מסמכים, או ב-50 תוצאות במצב חלוקה לחלקים, כדי ליצור סיכום. משתמשים במצב chunks כשמגדירים את SearchRequest.ContentSearchSpec.search_result_mode לערך CHUNKS.

includeCitations

boolean

מציין אם לכלול ציטוטים בסיכום. ערך ברירת המחדל הוא false.

אם השדה הזה מוגדר לערך true, הסיכומים כוללים מספרי ציטוטים בשורה.

סיכום לדוגמה שכולל ציטוטים:

‫BigQuery הוא מחסן נתונים (data warehouse) ארגוני מנוהל לחלוטין וללא שרתים של Google Cloud [1]. ‫BigQuery תומך בכל סוגי הנתונים, פועל בענן ויש לו למידת מכונה מובנית ובינה עסקית, והכל בפלטפורמה מאוחדת [2, 3].

מספרי הציטוטים מתייחסים לתוצאות החיפוש שהוחזרו, והם מבוססים על אינדקס שמתחיל ב-1. לדוגמה, [1] מציין שהמשפט משויך לתוצאת החיפוש הראשונה. ‫[2, 3] פירושו שהמשפט משויך לתוצאות החיפוש השנייה והשלישית.

ignoreAdversarialQuery

boolean

קובעת אם לסנן שאילתות שמנסות להערים על המערכת. ערך ברירת המחדל הוא false.

‫Google משתמשת בסיווג של שאילתות חיפוש כדי לזהות שאילתות עוינות. אם שאילתת החיפוש מסווגת כשאילתה עוינת, לא מוחזר סיכום. לדוגמה, משתמש יכול לשאול שאלה לגבי תגובות שליליות על החברה או לשלוח שאילתה שמיועדת ליצירת פלט לא בטוח שמפר את המדיניות. אם השדה הזה מוגדר לערך true, אנחנו מדלגים על יצירת סיכומים לשאילתות מתנגדות ומחזירים במקום זאת הודעות חלופיות.

ignoreNonSummarySeekingQuery

boolean

קובעת אם לסנן שאילתות שלא מחפשות סיכום. ערך ברירת המחדל הוא false.

‫Google משתמשת בסיווג של שאילתות חיפוש כדי לזהות שאילתות שמטרתן לקבל סיכום. אם שאילתת החיפוש מסווגת כשאילתה שלא מחפשת סיכום, לא מוחזר סיכום. לדוגמה, why is the sky blue ו-Who is the best soccer player in the world? הן שאילתות שמחפשות סיכום, אבל SFO airport ו-world cup 2026 לא. בדרך כלל אלה שאילתות ניווט. אם השדה הזה מוגדר לערך true, אנחנו מדלגים על יצירת סיכומים לשאילתות שלא מחפשות סיכומים, ומחזירים במקום זאת הודעות חלופיות.

ignoreLowRelevantContent

boolean

קובעת אם לסנן שאילתות עם רלוונטיות נמוכה. ערך ברירת המחדל הוא false.

אם השדה הזה מוגדר לערך false, נעשה שימוש בכל תוצאות החיפוש, ללא קשר לרלוונטיות שלהן, כדי ליצור תשובות. אם המצב מוגדר לtrue, רק שאילתות עם תוצאות חיפוש רלוונטיות מאוד יניבו תשובות.

ignoreJailBreakingQuery

boolean

זה שינוי אופציונלי. קובעת אם לסנן שאילתות שקשורות לפריצת מכשירים. ערך ברירת המחדל הוא false.

‫Google משתמשת בסיווג של שאילתות חיפוש כדי לזהות שאילתות שקשורות לפריצת מכשירים. אם שאילתת החיפוש מסווגת כשאילתה שמטרתה לפרוץ את המודל, לא מוחזר סיכום. משתמש יכול להוסיף הנחיות לשאילתה כדי לשנות את הטון, הסגנון, השפה או התוכן של התשובה, או לבקש מהמודל להתנהג כישות אחרת, למשל: "תענה בטון של מנכ"ל חברה מתחרה". אם השדה הזה מוגדר לערך true, אנחנו מדלגים על יצירת סיכומים לשאילתות שנועדו לעקוף את ההגבלות ומחזירים במקום זאת הודעות חלופיות.

modelPromptSpec

object (ModelPromptSpec)

אם מציינים מפרט, הוא ישמש לשינוי ההנחיה שמועברת ל-LLM.

languageCode

string

קוד השפה של הסיכום. צריך להשתמש בתגי שפה שמוגדרים על ידי BCP47. הערה: זוהי תכונה ניסיונית.

modelSpec

object (ModelSpec)

אם מציינים מפרט, המערכת משתמשת בו כדי לשנות את מפרט המודל שמועבר ל-LLM.

useSemanticChunks

boolean

אם הערך הוא true, התשובה תיווצר מהחלקים הכי רלוונטיים מתוצאות החיפוש העליונות. התכונה הזו תשפר את איכות הסיכום. חשוב לזכור שאם התכונה הזו מופעלת, לא כל תוצאות החיפוש העליונות יצוטטו וייכללו ברשימת המקורות, ולכן אינדקס מקורות הציטוטים מצביע רק על תוצאות החיפוש שמופיעות ברשימת המקורות.

ModelPromptSpec

המפרט של ההנחיה לשימוש עם המודל.

ייצוג ב-JSON
{
  "preamble": string
}
שדות
preamble

string

טקסט בתחילת ההנחיה שמנחה את העוזר הדיגיטלי. דוגמאות זמינות במדריך למשתמש.

ModelSpec

מפרט המודל.

ייצוג ב-JSON
{
  "version": string
}
שדות
version

string

גרסת המודל ששימשה ליצירת הסיכום.

הערכים הנתמכים הם:

ExtractiveContentSpec

מפרט להגדרת התוכן שחולץ בתשובה לשאילתת חיפוש.

ייצוג ב-JSON
{
  "maxExtractiveAnswerCount": integer,
  "maxExtractiveSegmentCount": integer,
  "returnExtractiveSegmentScore": boolean,
  "numPreviousSegments": integer,
  "numNextSegments": integer
}
שדות
maxExtractiveAnswerCount

integer

מספר התשובות המקסימלי שמופקות מתוך הטקסט ומוחזרות בכל תוצאת חיפוש.

תשובה חילוצית היא תשובה מילולית שחולצה מהמסמך המקורי, ומספקת תשובה מדויקת ורלוונטית להקשר של שאילתת החיפוש.

אם מספר התשובות התואמות קטן מ-maxExtractiveAnswerCount, הפונקציה מחזירה את כל התשובות. אחרת, הפונקציה מחזירה את maxExtractiveAnswerCount.

לכל SearchResult מוחזרות עד חמש תשובות.

maxExtractiveSegmentCount

integer

המספר המקסימלי של פלחים שמוחזרים בכל תוצאת חיפוש. ההגדרה חלה רק אם DataStore מוגדר ל-DataStore.ContentConfig.CONTENT_REQUIRED או אם DataStore.solution_types הוא SOLUTION_TYPE_CHAT.

קטע מידע חילוצי הוא קטע טקסט שחולץ מהמסמך המקורי, רלוונטי לשאילתת החיפוש, ובדרך כלל ארוך יותר מתשובה חילוצית. אפשר להשתמש בפלח כקלט למודלים מסוג LLM כדי ליצור סיכומים ותשובות.

אם מספר הקטעים התואמים קטן מ-maxExtractiveSegmentCount, הפונקציה מחזירה את כל הקטעים. אחרת, הפונקציה מחזירה את maxExtractiveSegmentCount.

returnExtractiveSegmentScore

boolean

מציינת אם להחזיר את ציון רמת הסמך מהפלחים שחולצו בכל תוצאת חיפוש. התכונה הזו זמינה רק למאגרי נתונים חדשים או למאגרי נתונים שנכללים ברשימת ההיתרים. כדי להוסיף את מאגר הנתונים לרשימת ההיתרים, צריך לפנות ל-Customer Engineer. ערך ברירת המחדל הוא false.

numPreviousSegments

integer

מציינים אם לכלול גם את הפלחים הסמוכים לכל אחד מהפלחים שנבחרו. החזרת numPreviousSegments פלחים לכל היותר לפני כל פלח שנבחר.

numNextSegments

integer

החזרת numNextSegments פלחים לכל היותר אחרי כל פלח שנבחר.

SearchResultMode

מציינת את מצב תוצאות החיפוש. אם לא מציינים מצב, ברירת המחדל של מצב תוצאות החיפוש היא DOCUMENTS.

טיפוסים בני מנייה (enum)
SEARCH_RESULT_MODE_UNSPECIFIED ערך ברירת המחדל.
DOCUMENTS החזרת מסמכים בתוצאת החיפוש.
CHUNKS הפונקציה מחזירה נתחים בתוצאת החיפוש. האפשרות הזו זמינה רק אם מציינים את DocumentProcessingConfig.chunking_config.

ChunkSpec

מציין את מפרט החלק שיוחזר מתשובת החיפוש. האפשרות זמינה רק אם בשדה SearchRequest.ContentSearchSpec.search_result_mode מגדירים את הערך CHUNKS

ייצוג ב-JSON
{
  "numPreviousChunks": integer,
  "numNextChunks": integer
}
שדות
numPreviousChunks

integer

מספר החלקים הקודמים שיוחזרו מהחלק הנוכחי. הערך המקסימלי המותר הוא 3. אם לא מציינים, לא יוחזרו נתונים קודמים.

numNextChunks

integer

מספר החלקים הבאים שיוחזרו מהחלק הנוכחי. הערך המקסימלי המותר הוא 3. אם לא מציינים את הערך הזה, לא יוחזרו נתונים של מקטעים הבאים.