משאב: Chunk
החלק הזה כולל את כל פרטי המטא-נתונים הגולמיים של הפריטים שיומלצו או ייכללו בחיפוש במצב החלק.
| ייצוג ב-JSON |
|---|
{ "name": string, "id": string, "content": string, "documentMetadata": { object ( |
| שדות | |
|---|---|
name |
השם המלא של המשאב של הנתח. פורמט: השדה הזה חייב להיות מחרוזת בקידוד UTF-8, עם מגבלת אורך של 1,024 תווים. |
id |
מזהה ייחודי של החלק הנוכחי. |
content |
התוכן הוא מחרוזת ממסמך (תוכן שנותח). |
documentMetadata |
מטא-נתונים של המסמך מהחלק הנוכחי. |
derivedStructData |
פלט בלבד. השדה הזה הוא OUTPUT_ONLY. הוא מכיל נתונים נגזרים שלא מופיעים במסמך המקורי. |
pageSpan |
טווח הדפים של החלק. |
chunkMetadata |
פלט בלבד. מטא-נתונים של הנתח הנוכחי. |
dataUrls[] |
פלט בלבד. כתובות URL של נתוני תמונות אם הצ'אנק הנוכחי מכיל תמונות. כתובות URL של נתונים מורכבות מארבעה חלקים: קידומת (data:), סוג MIME שמציין את סוג הנתונים, אסימון base64 אופציונלי אם הנתונים לא טקסטואליים, והנתונים עצמם: data:[ |
annotationContents[] |
פלט בלבד. תוכן ההערה אם החלק הנוכחי מכיל הערות. |
annotationMetadata[] |
פלט בלבד. המטא-נתונים של ההערה כוללים תוכן מובנה בחלק הנוכחי. |
relevanceScore |
פלט בלבד. מייצג את ציון הרלוונטיות על סמך הדמיון. ציון גבוה יותר מצביע על רלוונטיות גבוהה יותר של המקטע. הציון הוא בטווח [-1.0, 1.0]. המאפיין הזה מאוכלס רק ב- |
DocumentMetadata
המטא-נתונים של המסמך מכילים את המידע של המסמך של החלק הנוכחי.
| ייצוג ב-JSON |
|---|
{ "uri": string, "title": string, "mimeType": string, "structData": { object } } |
| שדות | |
|---|---|
uri |
כתובת ה-URI של המסמך. |
title |
שם המסמך. |
mimeType |
סוג ה-MIME של המסמך. https://www.iana.org/assignments/media-types/media-types.xhtml. |
structData |
ייצוג נתונים. נתוני ה-JSON המובְנים של המסמך. הערך צריך להיות תואם לערך הרשום |
PageSpan
טווח הדפים של החלק.
| ייצוג ב-JSON |
|---|
{ "pageStart": integer, "pageEnd": integer } |
| שדות | |
|---|---|
pageStart |
דף ההתחלה של החלק. |
pageEnd |
דף הסיום של קבוצת הנתונים. |
ChunkMetadata
מטא-נתונים של הנתח הנוכחי. השדה הזה מאוכלס רק ב-SearchService.Search API.
| ייצוג ב-JSON |
|---|
{ "previousChunks": [ { object ( |
| שדות | |
|---|---|
previousChunks[] |
החלקים הקודמים של החלק הנוכחי. המספר נשלט על ידי |
nextChunks[] |
החלקים הבאים של החלק הנוכחי. המספר נשלט על ידי |
AnnotationMetadata
המטא-נתונים של ההערה כוללים תוכן מובנה בחלק הנוכחי.
| ייצוג ב-JSON |
|---|
{
"structuredContent": {
object ( |
| שדות | |
|---|---|
structuredContent |
פלט בלבד. פרטי התוכן המובנה. |
imageId |
פלט בלבד. מזהה התמונה מסופק אם התוכן המובנה מבוסס על תמונה. |
StructuredContent
פרטי התוכן המובנה.
| ייצוג ב-JSON |
|---|
{
"structureType": enum ( |
| שדות | |
|---|---|
structureType |
פלט בלבד. סוג המבנה של התוכן המובנה. |
content |
פלט בלבד. התוכן של התוכן המובנה. |
StructureType
הגדרת סוגי התוכן המובנה שאפשר לחלץ.
| טיפוסים בני מנייה (enum) | |
|---|---|
STRUCTURE_TYPE_UNSPECIFIED |
ערך ברירת המחדל. |
SHAREHOLDER_STRUCTURE |
מבנה בעלי המניות. |
SIGNATURE_STRUCTURE |
מבנה החתימה. |
CHECKBOX_STRUCTURE |
מבנה תיבת הסימון. |
Methods |
|
|---|---|
|
הפונקציה מחזירה Document. |
|
מקבל רשימה של Chunk. |