Resource: Chunk
Chunk mencatat semua informasi metadata mentah item yang akan direkomendasikan atau dicari dalam mode chunk.
| Representasi JSON |
|---|
{ "name": string, "id": string, "content": string, "documentMetadata": { object ( |
| Kolom | |
|---|---|
name |
Nama lengkap resource potongan. Format Kolom ini harus berupa string berenkode UTF-8 dengan batas panjang 1.024 karakter. |
id |
ID potongan unik dari potongan saat ini. |
content |
Content adalah string dari dokumen (konten yang diuraikan). |
documentMetadata |
Metadata dokumen dari chunk saat ini. |
derivedStructData |
Hanya output. Kolom ini bersifat OUTPUT_ONLY. Objek ini berisi data turunan yang tidak ada dalam dokumen input asli. |
pageSpan |
Rentang halaman potongan. |
chunkMetadata |
Hanya output. Metadata potongan saat ini. |
dataUrls[] |
Hanya output. URL Data Gambar jika chunk saat ini berisi gambar. URL data terdiri dari empat bagian: awalan (data:), jenis MIME yang menunjukkan jenis data, token base64 opsional jika non-tekstual, dan data itu sendiri: data:[ |
annotationContents[] |
Hanya output. Isi anotasi jika chunk saat ini berisi anotasi. |
annotationMetadata[] |
Hanya output. Metadata anotasi mencakup konten terstruktur dalam potongan saat ini. |
relevanceScore |
Hanya output. Mewakili skor relevansi berdasarkan kemiripan. Skor yang lebih tinggi menunjukkan relevansi potongan yang lebih tinggi. Skor berada dalam rentang [-1.0, 1.0]. Hanya diisi di |
DocumentMetadata
Metadata dokumen berisi informasi dokumen potongan saat ini.
| Representasi JSON |
|---|
{ "uri": string, "title": string, "mimeType": string, "structData": { object } } |
| Kolom | |
|---|---|
uri |
URI dokumen. |
title |
Judul dokumen. |
mimeType |
Jenis MIME dokumen. https://www.iana.org/assignments/media-types/media-types.xhtml. |
structData |
Representasi data. Data JSON terstruktur untuk dokumen. Harus sesuai dengan |
PageSpan
Rentang halaman potongan.
| Representasi JSON |
|---|
{ "pageStart": integer, "pageEnd": integer } |
| Kolom | |
|---|---|
pageStart |
Halaman awal chunk. |
pageEnd |
Halaman akhir potongan. |
ChunkMetadata
Metadata potongan saat ini. Kolom ini hanya diisi di API SearchService.Search.
| Representasi JSON |
|---|
{ "previousChunks": [ { object ( |
| Kolom | |
|---|---|
previousChunks[] |
Chunk sebelumnya dari chunk saat ini. Nomor tersebut dikontrol oleh |
nextChunks[] |
Chunk berikutnya dari chunk saat ini. Nomor tersebut dikontrol oleh |
AnnotationMetadata
Metadata anotasi mencakup konten terstruktur dalam potongan saat ini.
| Representasi JSON |
|---|
{
"structuredContent": {
object ( |
| Kolom | |
|---|---|
structuredContent |
Hanya output. Informasi konten terstruktur. |
imageId |
Hanya output. ID gambar diberikan jika konten terstruktur didasarkan pada gambar. |
StructuredContent
Informasi konten terstruktur.
| Representasi JSON |
|---|
{
"structureType": enum ( |
| Kolom | |
|---|---|
structureType |
Hanya output. Jenis struktur konten terstruktur. |
content |
Hanya output. Konten konten terstruktur. |
StructureType
Mendefinisikan jenis konten terstruktur yang dapat diekstrak.
| Enum | |
|---|---|
STRUCTURE_TYPE_UNSPECIFIED |
Nilai default. |
SHAREHOLDER_STRUCTURE |
Struktur pemegang saham. |
SIGNATURE_STRUCTURE |
struktur tanda tangan. |
CHECKBOX_STRUCTURE |
Struktur kotak centang. |
Metode |
|
|---|---|
|
Mendapatkan Document. |
|
Mendapatkan daftar Chunk. |