- Risorsa: DataStore
- Rappresentazione JSON
- ContentConfig
- AdvancedSiteSearchConfig
- BillingEstimation
- WorkspaceConfig
- Tipo
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Metodi
Risorsa: DataStore
DataStore acquisisce le impostazioni e le configurazioni globali a livello di datastore.
Rappresentazione JSON |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
Campi | |
---|---|
name |
Immutabile. Identificatore. Il nome completo della risorsa del datastore. Formato: Questo campo deve essere una stringa codificata in UTF-8 con un limite di lunghezza di 1024 caratteri. |
displayName |
Obbligatorio. Il nome visualizzato del datastore. Questo campo deve essere una stringa codificata in UTF-8 con un limite di lunghezza di 128 caratteri. In caso contrario, viene restituito un errore INVALID_ARGUMENT. |
industryVertical |
Immutabile. Il verticale del settore registrato dal datastore. |
solutionTypes[] |
Le soluzioni registrate dal datastore. Soluzioni disponibili per ogni
|
defaultSchemaId |
Solo output. L'ID del |
contentConfig |
Immutabile. La configurazione dei contenuti del datastore. Se questo campo non è impostato, il comportamento del server è |
createTime |
Solo output. Timestamp della creazione di Utilizza RFC 3339, in cui l'output generato è sempre normalizzato in base al fuso orario UTC e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: |
advancedSiteSearchConfig |
Facoltativo. Configurazione per la ricerca avanzata sul sito. |
kmsKeyName |
Solo input. La chiave KMS da utilizzare per proteggere questo datastore al momento della creazione. Deve essere impostato per le richieste che devono essere conformi alle protezioni delle policy dell'organizzazione CMEK. Se questo campo è impostato ed elaborato correttamente, il datastore sarà protetto dalla chiave KMS, come indicato nel campo cmekConfig. |
cmekConfig |
Solo output. Informazioni relative a CMEK per Datastore. |
billingEstimation |
Solo output. Stima delle dimensioni dei dati per la fatturazione. |
aclEnabled |
Immutabile. Se i dati in Quando l'ACL è abilitata per Al momento, gli ACL sono supportati solo nel verticale del settore |
workspaceConfig |
Configurazione per archiviare la configurazione del tipo di datastore per i dati del workspace. Questo valore deve essere impostato quando |
documentProcessingConfig |
Configurazione per la comprensione e l'arricchimento dei documenti. |
startingSchema |
Lo schema iniziale da utilizzare per questo Questo campo viene utilizzato solo dall'API Lo schema fornito verrà convalidato in base a determinate regole dello schema. Scopri di più in questo documento. |
healthcareFhirConfig |
Facoltativo. Configurazione per la verticale |
servingConfigDataStore |
Facoltativo. Configurazione del servizio di archiviazione a livello di datastore. |
identityMappingStore |
Immutabile. Il nome risorsa completo del |
isInfobotFaqDataStore |
Facoltativo. Se impostato, questo datastore è un datastore FAQ di Infobot. |
configurableBillingApproach |
Facoltativo. Configurazione per l'approccio di fatturazione configurabile. Consulta |
ContentConfig
Configurazione dei contenuti del datastore.
Enum | |
---|---|
CONTENT_CONFIG_UNSPECIFIED |
Valore predefinito. |
NO_CONTENT |
Contiene solo documenti senza Document.content . |
CONTENT_REQUIRED |
Contiene solo documenti con Document.content . |
PUBLIC_WEBSITE |
Il datastore viene utilizzato per la ricerca sul sito web pubblico. |
GOOGLE_WORKSPACE |
Il datastore viene utilizzato per la ricerca di Workspace. I dettagli dell'datastore del workspace sono specificati in WorkspaceConfig . |
AdvancedSiteSearchConfig
Dati di configurazione per la ricerca avanzata sul sito.
Rappresentazione JSON |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
Campi | |
---|---|
disableInitialIndex |
Se impostato su true, l'indicizzazione iniziale viene disattivata per DataStore. |
disableAutomaticRefresh |
Se è impostato su true, l'aggiornamento automatico è disattivato per DataStore. |
BillingEstimation
Stima delle dimensioni dei dati per datastore.
Rappresentazione JSON |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
Campi | |
---|---|
structuredDataSize |
Dimensioni dei dati strutturati in byte. |
unstructuredDataSize |
Dimensione dei dati non strutturati in byte. |
websiteDataSize |
Dimensioni dei dati per i siti web in termini di byte. |
structuredDataUpdateTime |
Timestamp dell'ultimo aggiornamento per i dati strutturati. Utilizza RFC 3339, in cui l'output generato è sempre normalizzato in base al fuso orario UTC e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: |
unstructuredDataUpdateTime |
Timestamp dell'ultimo aggiornamento per i dati non strutturati. Utilizza RFC 3339, in cui l'output generato è sempre normalizzato in base al fuso orario UTC e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: |
websiteDataUpdateTime |
Timestamp dell'ultimo aggiornamento per i siti web. Utilizza RFC 3339, in cui l'output generato è sempre normalizzato in base al fuso orario UTC e utilizza 0, 3, 6 o 9 cifre frazionarie. Sono accettati anche offset diversi da "Z". Esempi: |
WorkspaceConfig
Configurazione per archiviare la configurazione del tipo di datastore per i dati del workspace
Rappresentazione JSON |
---|
{
"type": enum ( |
Campi | |
---|---|
type |
L'origine dati Google Workspace. |
dasherCustomerId |
ID cliente Dasher offuscato. |
superAdminServiceAccount |
Facoltativo. Il account di servizio super amministratore dello spazio di lavoro che verrà utilizzato per la generazione del token di accesso. Per il momento lo utilizziamo solo per l'importazione dati del connettore Google Drive nativo. |
superAdminEmailAddress |
Facoltativo. L'indirizzo email del super amministratore dello spazio di lavoro che verrà utilizzato per la generazione del token di accesso. Per il momento lo utilizziamo solo per l'importazione dati del connettore Google Drive nativo. |
Tipo
Specifica il tipo di app Workspace supportata da questo datastore
Enum | |
---|---|
TYPE_UNSPECIFIED |
Il valore predefinito è un tipo di workspace non specificato. |
GOOGLE_DRIVE |
L'datastore di Workspace contiene i dati di Drive |
GOOGLE_MAIL |
L'datastore di Workspace contiene dati di posta |
GOOGLE_SITES |
Il datastore Workspace contiene i dati di Sites |
GOOGLE_CALENDAR |
Il datastore Workspace contiene dati di Calendar |
GOOGLE_CHAT |
Il datastore di Workspace contiene i dati di Chat |
GOOGLE_GROUPS |
L'datastore di Workspace contiene i dati di Gruppi |
GOOGLE_KEEP |
Il datastore di Workspace contiene i dati di Keep |
GOOGLE_PEOPLE |
Il datastore di Workspace contiene dati di People |
DocumentProcessingConfig
Una risorsa singleton di DataStore
. Se è vuoto quando viene creato DataStore
e DataStore
è impostato su DataStore.ContentConfig.CONTENT_REQUIRED
, il parser predefinito verrà impostato sul parser digitale.
Rappresentazione JSON |
---|
{ "name": string, "chunkingConfig": { object ( |
Campi | |
---|---|
name |
Il nome completo della risorsa della configurazione dell'elaborazione dei documenti. Formato: |
chunkingConfig |
Indica se la modalità di suddivisione è attivata. |
defaultParsingConfig |
Configurazioni per il parser predefinito dei documenti. Se non specificato, verrà configurato come DigitalParsingConfig predefinito e la configurazione di analisi predefinita verrà applicata a tutti i tipi di file per l'analisi dei documenti. |
parsingConfigOverrides |
Mappa dal tipo di file per eseguire l'override della configurazione di analisi predefinita in base al tipo di file. Chiavi supportate:
|
ChunkingConfig
Configurazione per la configurazione della suddivisione in blocchi.
Rappresentazione JSON |
---|
{ // Union field |
Campi | |
---|---|
Campo unione chunk_mode . Configurazioni aggiuntive che definiscono il comportamento della suddivisione in blocchi. chunk_mode può essere solo uno dei seguenti: |
|
layoutBasedChunkingConfig |
Configurazione per la suddivisione in blocchi basata sul layout. |
LayoutBasedChunkingConfig
Configurazione per la suddivisione in blocchi basata sul layout.
Rappresentazione JSON |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
Campi | |
---|---|
chunkSize |
Il limite di dimensioni dei token per ogni blocco. Valori supportati: 100-500 (estremi inclusi). Valore predefinito: 500. |
includeAncestorHeadings |
Se includere l'aggiunta di diversi livelli di intestazioni ai chunk dalla parte centrale del documento per evitare la perdita di contesto. Valore predefinito: False. |
ParsingConfig
Configurazioni correlate applicate a un tipo specifico di parser dei documenti.
Rappresentazione JSON |
---|
{ // Union field |
Campi | |
---|---|
Campo unione type_dedicated_config . Configurazioni per i tipi di elaborazione dei documenti. type_dedicated_config può essere solo uno dei seguenti: |
|
digitalParsingConfig |
Configurazioni applicate al parser digitale. |
ocrParsingConfig |
Configurazioni applicate al parser OCR. Al momento si applica solo ai PDF. |
layoutParsingConfig |
Configurazioni applicate al parser layout. |
DigitalParsingConfig
Questo tipo non contiene campi.
Le configurazioni di analisi digitale per i documenti.
OcrParsingConfig
Le configurazioni di analisi OCR per i documenti.
Rappresentazione JSON |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
Campi | |
---|---|
enhancedDocumentElements[] |
[OBSOLETO] Questo campo è obsoleto. Per utilizzare l'elaborazione aggiuntiva degli elementi avanzati del documento, passa a |
useNativeText |
Se il valore è vero, verrà utilizzato il testo nativo anziché il testo OCR nelle pagine contenenti testo nativo. |
LayoutParsingConfig
Le configurazioni di analisi del layout per i documenti.
Rappresentazione JSON |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
Campi | |
---|---|
enableTableAnnotation |
Facoltativo. Se true, l'annotazione basata su LLM viene aggiunta alla tabella durante l'analisi. |
enableImageAnnotation |
Facoltativo. Se il valore è impostato su True, durante l'analisi viene aggiunta un'annotazione basata su LLM all'immagine. |
structuredContentTypes[] |
Facoltativo. Contiene i tipi di struttura richiesti da estrarre dal documento. Valori supportati:
|
excludeHtmlElements[] |
Facoltativo. Elenco degli elementi HTML da escludere dai contenuti analizzati. |
excludeHtmlClasses[] |
Facoltativo. Elenco delle classi HTML da escludere dai contenuti analizzati. |
excludeHtmlIds[] |
Facoltativo. Elenco di ID HTML da escludere dai contenuti analizzati. |
enableGetProcessedDocument |
Facoltativo. Se è true, il documento elaborato sarà disponibile per l'API GetProcessedDocument. |
HealthcareFhirConfig
Configurazione del datastore per la verticale HEALTHCARE_FHIR
.
Rappresentazione JSON |
---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
Campi | |
---|---|
enableConfigurableSchema |
Se abilitare lo schema configurabile per la verticale Se impostato su |
enableStaticIndexingForBatchIngestion |
Se abilitare l'indicizzazione statica per l'importazione batch di Se impostato su |
ServingConfigDataStore
Memorizza le informazioni relative alle configurazioni di pubblicazione a livello di DataStore.
Rappresentazione JSON |
---|
{ "disabledForServing": boolean } |
Campi | |
---|---|
disabledForServing |
Facoltativo. Se impostato su true, DataStore non sarà disponibile per la gestione delle richieste di ricerca. |
ConfigurableBillingApproach
Configurazione per l'approccio di fatturazione configurabile.
Enum | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Valore predefinito. Per l'approccio di fatturazione non configurabile Spark e non Spark. |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Utilizza la fatturazione base + eccedenza dell'abbonamento per l'indicizzazione di base per l'archiviazione non incorporata. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Utilizza la fatturazione a consumo per il componente aggiuntivo di archiviazione per l'incorporamento. |
Metodi |
|
---|---|
|
Completa l'input utente specificato con i suggerimenti per le parole chiave. |
|
Crea un DataStore . |
|
Elimina un DataStore . |
|
Riceve un DataStore . |
|
Ottiene SiteSearchEngine . |
|
Elenca tutti i DataStore associati al progetto. |
|
Aggiornamenti a DataStore |
|
Addestra un modello personalizzato. |