- Resource: DataStore
- Representasi JSON
- ContentConfig
- AdvancedSiteSearchConfig
- LanguageInfo
- NaturalLanguageQueryUnderstandingConfig
- Mode
- BillingEstimation
- WorkspaceConfig
- Jenis
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Metode
Resource: DataStore
DataStore merekam setelan dan konfigurasi global di tingkat DataStore.
Representasi JSON |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
Kolom | |
---|---|
name |
Tidak dapat diubah. ID. Nama lengkap resource penyimpanan data. Format Kolom ini harus berupa string berenkode UTF-8 dengan batas panjang 1.024 karakter. |
displayName |
Wajib. Nama tampilan penyimpanan data. Kolom ini harus berupa string berenkode UTF-8 dengan batas panjang 128 karakter. Jika tidak, error INVALID_ARGUMENT akan ditampilkan. |
industryVertical |
Tidak dapat diubah. Bidang industri yang didaftarkan oleh penyimpanan data. |
solutionTypes[] |
Solusi yang didaftarkan oleh penyimpanan data. Solusi yang tersedia untuk setiap
|
defaultSchemaId |
Hanya output. ID |
contentConfig |
Tidak dapat diubah. Konfigurasi konten penyimpanan data. Jika kolom ini tidak disetel, perilaku server akan ditetapkan secara default ke |
createTime |
Hanya output. Stempel waktu saat Menggunakan RFC 3339 yang outputnya akan selalu dinormalisasi Z dan menggunakan 0, 3, 6, atau 9 digit pecahan. Offset selain "Z" juga diterima. Contoh: |
advancedSiteSearchConfig |
Opsional. Konfigurasi untuk penelusuran situs lanjutan. |
languageInfo |
Info bahasa untuk DataStore. |
naturalLanguageQueryUnderstandingConfig |
Opsional. Konfigurasi untuk Pemahaman Kueri Bahasa Alami. |
kmsKeyName |
Hanya input. Kunci KMS yang akan digunakan untuk melindungi DataStore ini pada saat pembuatan. Harus ditetapkan untuk permintaan yang perlu mematuhi perlindungan Kebijakan Org. CMEK. Jika kolom ini ditetapkan dan diproses dengan berhasil, DataStore akan dilindungi oleh kunci KMS, seperti yang ditunjukkan di kolom cmekConfig. |
cmekConfig |
Hanya output. Informasi terkait CMEK untuk DataStore. |
billingEstimation |
Hanya output. Estimasi ukuran data untuk penagihan. |
aclEnabled |
Tidak dapat diubah. Apakah data dalam Jika ACL diaktifkan untuk Saat ini, ACL hanya didukung di vertikal industri |
workspaceConfig |
Konfigurasi untuk menyimpan konfigurasi jenis penyimpanan data untuk data ruang kerja. Properti ini harus ditetapkan jika |
documentProcessingConfig |
Konfigurasi untuk Pemahaman dan pengayaan dokumen. |
startingSchema |
Skema awal yang akan digunakan untuk Kolom ini hanya digunakan oleh API Skema yang diberikan akan divalidasi terhadap aturan tertentu pada schema.org. Pelajari lebih lanjut dari dokumen ini. |
healthcareFhirConfig |
Opsional. Konfigurasi untuk vertikal |
servingConfigDataStore |
Opsional. Menyimpan konfigurasi penayangan di tingkat DataStore. |
identityMappingStore |
Tidak dapat diubah. Nama resource yang sepenuhnya memenuhi syarat dari |
isInfobotFaqDataStore |
Opsional. Jika disetel, DataStore ini adalah DataStore FAQ Infobot. |
configurableBillingApproach |
Opsional. Konfigurasi untuk pendekatan penagihan yang dapat dikonfigurasi. Lihat |
ContentConfig
Konfigurasi konten penyimpanan data.
Enum | |
---|---|
CONTENT_CONFIG_UNSPECIFIED |
Nilai default. |
NO_CONTENT |
Hanya berisi dokumen tanpa Document.content . |
CONTENT_REQUIRED |
Hanya berisi dokumen dengan Document.content . |
PUBLIC_WEBSITE |
Penyimpanan data digunakan untuk penelusuran situs publik. |
GOOGLE_WORKSPACE |
Penyimpanan data digunakan untuk penelusuran ruang kerja. Detail penyimpanan data ruang kerja ditentukan dalam WorkspaceConfig . |
AdvancedSiteSearchConfig
Data konfigurasi untuk penelusuran situs lanjutan.
Representasi JSON |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
Kolom | |
---|---|
disableInitialIndex |
Jika disetel ke benar (true), pengindeksan awal dinonaktifkan untuk DataStore. |
disableAutomaticRefresh |
Jika disetel ke benar (true), refresh otomatis akan dinonaktifkan untuk DataStore. |
LanguageInfo
Info bahasa untuk DataStore.
Representasi JSON |
---|
{ "languageCode": string, "normalizedLanguageCode": string, "language": string, "region": string } |
Kolom | |
---|---|
languageCode |
Kode bahasa untuk DataStore. |
normalizedLanguageCode |
Hanya output. Ini adalah bentuk yang dinormalisasi dari languageCode. Misalnya: languageCode |
language |
Hanya output. Bagian bahasa dari normalizedLanguageCode. E.g.: |
region |
Hanya output. Bagian wilayah normalizedLanguageCode, jika ada. E.g.: |
NaturalLanguageQueryUnderstandingConfig
Konfigurasi untuk Pemahaman Kueri Bahasa Alami.
Representasi JSON |
---|
{
"mode": enum ( |
Kolom | |
---|---|
mode |
Mode Pemahaman Kueri Bahasa Alami. Jika kolom ini tidak disetel, perilaku akan ditetapkan secara default ke |
Mode
Mode Pemahaman Kueri Bahasa Alami. Jika NaturalLanguageQueryUnderstandingConfig.Mode adalah ENABLED, kemampuan pemahaman bahasa alami akan diaktifkan untuk permintaan penelusuran jika NaturalLanguageQueryUnderstandingSpec.FilterExtractionCondition di SearchRequest adalah ENABLED.
Enum | |
---|---|
MODE_UNSPECIFIED |
Nilai default. |
DISABLED |
Pemahaman Kueri Bahasa Alami dinonaktifkan. |
ENABLED |
Pemahaman Kueri Bahasa Alami diaktifkan. |
BillingEstimation
Estimasi ukuran data per penyimpanan data.
Representasi JSON |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
Kolom | |
---|---|
structuredDataSize |
Ukuran data untuk data terstruktur dalam byte. |
unstructuredDataSize |
ukuran data untuk data tidak terstruktur dalam satuan byte. |
websiteDataSize |
ukuran data untuk situs dalam byte. |
structuredDataUpdateTime |
Stempel waktu terakhir diperbarui untuk data terstruktur. Menggunakan RFC 3339 yang outputnya akan selalu dinormalisasi Z dan menggunakan 0, 3, 6, atau 9 digit pecahan. Offset selain "Z" juga diterima. Contoh: |
unstructuredDataUpdateTime |
Stempel waktu terakhir diperbarui untuk data tidak terstruktur. Menggunakan RFC 3339 yang outputnya akan selalu dinormalisasi Z dan menggunakan 0, 3, 6, atau 9 digit pecahan. Offset selain "Z" juga diterima. Contoh: |
websiteDataUpdateTime |
Stempel waktu terakhir diperbarui untuk situs. Menggunakan RFC 3339 yang outputnya akan selalu dinormalisasi Z dan menggunakan 0, 3, 6, atau 9 digit pecahan. Offset selain "Z" juga diterima. Contoh: |
WorkspaceConfig
Konfigurasi untuk menyimpan konfigurasi jenis penyimpanan data untuk data ruang kerja
Representasi JSON |
---|
{
"type": enum ( |
Kolom | |
---|---|
type |
Sumber data Google Workspace. |
dasherCustomerId |
ID pelanggan Dasher yang di-obfuscate. |
superAdminServiceAccount |
Opsional. Akun layanan admin super untuk ruang kerja yang akan digunakan untuk pembuatan token akses. Untuk saat ini, kami hanya menggunakannya untuk penyerapan data konektor Google Drive Native. |
superAdminEmailAddress |
Opsional. Alamat email admin super untuk ruang kerja yang akan digunakan untuk pembuatan token akses. Untuk saat ini, kami hanya menggunakannya untuk penyerapan data konektor Google Drive Native. |
Jenis
Menentukan jenis Aplikasi Workspace yang didukung oleh DataStore ini
Enum | |
---|---|
TYPE_UNSPECIFIED |
Secara default, jenis Ruang Kerja tidak ditentukan. |
GOOGLE_DRIVE |
Penyimpanan data Workspace berisi data Drive |
GOOGLE_MAIL |
Penyimpanan data Workspace berisi data email |
GOOGLE_SITES |
Penyimpanan data Workspace berisi data Situs |
GOOGLE_CALENDAR |
Penyimpanan data Workspace berisi data Kalender |
GOOGLE_CHAT |
Penyimpanan data Workspace berisi data Chat |
GOOGLE_GROUPS |
Penyimpanan data Workspace berisi data Grup |
GOOGLE_KEEP |
Penyimpanan data Workspace berisi data Keep |
GOOGLE_PEOPLE |
Penyimpanan data Workspace berisi data Orang |
DocumentProcessingConfig
Resource singleton DataStore
. Jika kosong saat DataStore
dibuat dan DataStore
disetel ke DataStore.ContentConfig.CONTENT_REQUIRED
, parser default akan menggunakan parser digital secara default.
Representasi JSON |
---|
{ "name": string, "chunkingConfig": { object ( |
Kolom | |
---|---|
name |
Nama lengkap resource Konfigurasi Pemrosesan Dokumen. Format |
chunkingConfig |
Apakah mode chunking diaktifkan. |
defaultParsingConfig |
Konfigurasi untuk Pengurai dokumen default. Jika tidak ditentukan, kami akan mengonfigurasinya sebagai DigitalParsingConfig default, dan konfigurasi parsing default akan diterapkan ke semua jenis file untuk parsing Dokumen. |
parsingConfigOverrides |
Memetakan dari jenis file untuk mengganti konfigurasi parsing default berdasarkan jenis file. Kunci yang didukung:
|
ChunkingConfig
Konfigurasi untuk konfigurasi pemotongan.
Representasi JSON |
---|
{ // Union field |
Kolom | |
---|---|
Kolom union chunk_mode . Konfigurasi tambahan yang menentukan perilaku chunking. chunk_mode hanya ada berupa salah satu diantara berikut: |
|
layoutBasedChunkingConfig |
Konfigurasi untuk chunking berbasis tata letak. |
LayoutBasedChunkingConfig
Konfigurasi untuk chunking berbasis tata letak.
Representasi JSON |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
Kolom | |
---|---|
chunkSize |
Batas ukuran token untuk setiap bagian. Nilai yang didukung: 100-500 (inklusif). Nilai default: 500. |
includeAncestorHeadings |
Apakah akan menyertakan penambahan berbagai tingkat judul ke bagian dari tengah dokumen untuk mencegah hilangnya konteks. Nilai default: False. |
ParsingConfig
Konfigurasi terkait yang diterapkan ke jenis parser dokumen tertentu.
Representasi JSON |
---|
{ // Union field |
Kolom | |
---|---|
Kolom union type_dedicated_config . Konfigurasi untuk jenis pemrosesan dokumen. type_dedicated_config hanya ada berupa salah satu diantara berikut: |
|
digitalParsingConfig |
Konfigurasi yang diterapkan ke parser digital. |
ocrParsingConfig |
Konfigurasi diterapkan ke parser OCR. Saat ini hanya berlaku untuk PDF. |
layoutParsingConfig |
Konfigurasi diterapkan ke parser tata letak. |
DigitalParsingConfig
Jenis ini tidak memiliki kolom.
Konfigurasi penguraian digital untuk dokumen.
OcrParsingConfig
Konfigurasi penguraian OCR untuk dokumen.
Representasi JSON |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
Kolom | |
---|---|
enhancedDocumentElements[] |
[TIDAK DIGUNAKAN LAGI] Kolom ini tidak digunakan lagi. Untuk menggunakan pemrosesan elemen dokumen yang ditingkatkan tambahan, beralihlah ke |
useNativeText |
Jika benar, akan menggunakan teks asli, bukan teks OCR di halaman yang berisi teks asli. |
LayoutParsingConfig
Konfigurasi penguraian tata letak untuk dokumen.
Representasi JSON |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
Kolom | |
---|---|
enableTableAnnotation |
Opsional. Jika benar, anotasi berbasis LLM akan ditambahkan ke tabel selama penguraian. |
enableImageAnnotation |
Opsional. Jika benar, anotasi berbasis LLM akan ditambahkan ke gambar selama penguraian. |
structuredContentTypes[] |
Opsional. Berisi jenis struktur yang diperlukan untuk diekstrak dari dokumen. Nilai yang didukung:
|
excludeHtmlElements[] |
Opsional. Daftar elemen HTML yang akan dikecualikan dari konten yang diuraikan. |
excludeHtmlClasses[] |
Opsional. Daftar class HTML yang akan dikecualikan dari konten yang diuraikan. |
excludeHtmlIds[] |
Opsional. Daftar ID HTML yang akan dikecualikan dari konten yang diuraikan. |
enableGetProcessedDocument |
Opsional. Jika benar, dokumen yang diproses akan tersedia untuk GetProcessedDocument API. |
HealthcareFhirConfig
Konfigurasi ke penyimpanan data untuk vertikal HEALTHCARE_FHIR
.
Representasi JSON |
---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
Kolom | |
---|---|
enableConfigurableSchema |
Apakah akan mengaktifkan skema yang dapat dikonfigurasi untuk vertikal Jika disetel ke |
enableStaticIndexingForBatchIngestion |
Apakah akan mengaktifkan pengindeksan statis untuk penyerapan batch Jika disetel ke |
ServingConfigDataStore
Menyimpan informasi terkait konfigurasi penayangan di tingkat DataStore.
Representasi JSON |
---|
{ "disabledForServing": boolean } |
Kolom | |
---|---|
disabledForServing |
Opsional. Jika disetel ke benar (true), DataStore tidak akan tersedia untuk menayangkan permintaan penelusuran. |
ConfigurableBillingApproach
Konfigurasi untuk pendekatan penagihan yang dapat dikonfigurasi.
Enum | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Nilai default. Untuk pendekatan penagihan yang tidak dapat dikonfigurasi Spark dan non-Spark. |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Gunakan penagihan berbasis langganan + kelebihan penggunaan untuk pengindeksan inti bagi penyimpanan non-penyematan. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Gunakan penagihan bayar sesuai penggunaan untuk add-on penyimpanan penyematan. |
Metode |
|
---|---|
|
Melengkapi input pengguna yang ditentukan dengan saran kata kunci. |
|
Membuat DataStore . |
|
Menghapus DataStore . |
|
Mendapatkan DataStore . |
|
Mendapatkan SiteSearchEngine . |
|
Mencantumkan semua DataStore yang terkait dengan project. |
|
Memperbarui DataStore |
|
Melatih model kustom. |