- Recurso: DataStore
- Representação JSON
- ContentConfig
- AdvancedSiteSearchConfig
- LanguageInfo
- NaturalLanguageQueryUnderstandingConfig
- Modo
- BillingEstimation
- WorkspaceConfig
- Tipo
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Métodos
Recurso: DataStore
O DataStore captura definições e configurações globais ao nível do DataStore.
Representação JSON |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
Campos | |
---|---|
name |
Imutável. Identificador. O nome completo do recurso do armazenamento de dados. Formato: Este campo tem de ser uma string codificada em UTF-8 com um limite de comprimento de 1024 carateres. |
displayName |
Obrigatório. O nome a apresentar da loja de dados. Este campo tem de ser uma string codificada em UTF-8 com um limite de 128 carateres. Caso contrário, é devolvido um erro INVALID_ARGUMENT. |
industryVertical |
Imutável. A vertical do setor que a base de dados regista. |
solutionTypes[] |
As soluções que o arquivo de dados inscreve. Soluções disponíveis para cada
|
defaultSchemaId |
Apenas saída. O ID do |
contentConfig |
Imutável. A configuração de conteúdo do arquivo de dados. Se este campo não for definido, o comportamento do servidor é predefinido para |
createTime |
Apenas saída. Data/hora de criação do Usa RFC 3339, em que o resultado gerado é sempre normalizado em Z e usa 0, 3, 6 ou 9 dígitos fracionários. Também são aceites desvios diferentes de "Z". Exemplos: |
advancedSiteSearchConfig |
Opcional. Configuração para a pesquisa no site avançada. |
languageInfo |
Informações de idioma para o DataStore. |
naturalLanguageQueryUnderstandingConfig |
Opcional. Configuração para a compreensão de consultas de linguagem natural. |
kmsKeyName |
Apenas entrada. A chave do KMS a usar para proteger este DataStore no momento da criação. Tem de ser definido para pedidos que têm de estar em conformidade com as proteções da política organizacional da CMEK. Se este campo estiver definido e for processado com êxito, o DataStore é protegido pela chave do KMS, conforme indicado no campo cmekConfig. |
cmekConfig |
Apenas saída. Informações relacionadas com a CMEK para o DataStore. |
billingEstimation |
Apenas saída. Estimativa do tamanho dos dados para faturação. |
aclEnabled |
Imutável. Se os dados no ficheiro Quando a ACL está ativada para o elemento Atualmente, a ACL só é suportada no setor vertical |
workspaceConfig |
Configuração para armazenar a configuração do tipo de armazenamento de dados para dados do Workspace. Tem de ser definido quando |
documentProcessingConfig |
Configuração para a interpretação e o enriquecimento de documentos. |
startingSchema |
O esquema de início a usar para este Este campo só é usado pela API O esquema fornecido é validado em função de determinadas regras no esquema. Saiba mais neste documento. |
healthcareFhirConfig |
Opcional. Configuração para o vertical |
servingConfigDataStore |
Opcional. Armazena a configuração de publicação ao nível do DataStore. |
identityMappingStore |
Imutável. O nome do recurso totalmente qualificado do |
isInfobotFaqDataStore |
Opcional. Se estiver definido, este DataStore é um DataStore de Perguntas frequentes do Infobot. |
configurableBillingApproach |
Opcional. Configuração para uma abordagem de faturação configurável. Consulte |
ContentConfig
Configuração do conteúdo do arquivo de dados.
Enumerações | |
---|---|
CONTENT_CONFIG_UNSPECIFIED |
Valor predefinido. |
NO_CONTENT |
Contém apenas documentos sem Document.content . |
CONTENT_REQUIRED |
Contém apenas documentos com Document.content . |
PUBLIC_WEBSITE |
O armazenamento de dados é usado para a pesquisa pública de Websites. |
GOOGLE_WORKSPACE |
O armazenamento de dados é usado para a pesquisa do espaço de trabalho. Os detalhes do arquivo de dados do espaço de trabalho são especificados no WorkspaceConfig . |
AdvancedSiteSearchConfig
Dados de configuração para a pesquisa no site avançada.
Representação JSON |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
Campos | |
---|---|
disableInitialIndex |
Se for definida como verdadeira, a indexação inicial é desativada para o DataStore. |
disableAutomaticRefresh |
Se for definida como verdadeira, a atualização automática é desativada para o DataStore. |
LanguageInfo
Informações de idioma para o DataStore.
Representação JSON |
---|
{ "languageCode": string, "normalizedLanguageCode": string, "language": string, "region": string } |
Campos | |
---|---|
languageCode |
O código de idioma do DataStore. |
normalizedLanguageCode |
Apenas saída. Esta é a forma normalizada de languageCode. Por exemplo: o languageCode de |
language |
Apenas saída. Idioma que faz parte de normalizedLanguageCode. E.g.: |
region |
Apenas saída. Região que faz parte de normalizedLanguageCode, se presente. E.g.: |
NaturalLanguageQueryUnderstandingConfig
Configuração para a compreensão de consultas de linguagem natural.
Representação JSON |
---|
{
"mode": enum ( |
Campos | |
---|---|
mode |
Modo de compreensão de consultas de linguagem natural. Se este campo não estiver definido, o comportamento é predefinido para |
Modo
Modo de compreensão de consultas de linguagem natural. Quando NaturalLanguageQueryUnderstandingConfig.Mode é ENABLED, as capacidades de compreensão de linguagem natural são ativadas para um pedido de pesquisa se NaturalLanguageQueryUnderstandingSpec.FilterExtractionCondition em SearchRequest for ENABLED.
Enumerações | |
---|---|
MODE_UNSPECIFIED |
Valor predefinido. |
DISABLED |
A compreensão de consultas de linguagem natural está desativada. |
ENABLED |
A compreensão de consultas de linguagem natural está ativada. |
BillingEstimation
Estimativa do tamanho dos dados por arquivo de dados.
Representação JSON |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
Campos | |
---|---|
structuredDataSize |
Tamanho dos dados para dados estruturados em bytes. |
unstructuredDataSize |
Tamanho dos dados não estruturados em bytes. |
websiteDataSize |
tamanho dos dados para Websites em bytes. |
structuredDataUpdateTime |
Data/hora da última atualização dos dados estruturados. Usa RFC 3339, em que o resultado gerado é sempre normalizado em Z e usa 0, 3, 6 ou 9 dígitos fracionários. Também são aceites desvios diferentes de "Z". Exemplos: |
unstructuredDataUpdateTime |
Data/hora da última atualização dos dados não estruturados. Usa RFC 3339, em que o resultado gerado é sempre normalizado em Z e usa 0, 3, 6 ou 9 dígitos fracionários. Também são aceites desvios diferentes de "Z". Exemplos: |
websiteDataUpdateTime |
Data/hora da última atualização para Websites. Usa RFC 3339, em que o resultado gerado é sempre normalizado em Z e usa 0, 3, 6 ou 9 dígitos fracionários. Também são aceites desvios diferentes de "Z". Exemplos: |
WorkspaceConfig
Configuração para armazenar a configuração do tipo de arquivo de dados para dados do Workspace
Representação JSON |
---|
{
"type": enum ( |
Campos | |
---|---|
type |
A origem de dados do Google Workspace. |
dasherCustomerId |
ID de cliente do Dasher ocultado. |
superAdminServiceAccount |
Opcional. A conta de serviço de superadministrador do espaço de trabalho que vai ser usada para a geração do token de acesso. Por agora, só a usamos para a obtenção de dados do conetor do Google Drive nativo. |
superAdminEmailAddress |
Opcional. O endereço de email do superadministrador do espaço de trabalho que vai ser usado para a geração do token de acesso. Por agora, só a usamos para a obtenção de dados do conetor do Google Drive nativo. |
Tipo
Especifica o tipo de app do Workspace suportado por este DataStore
Enumerações | |
---|---|
TYPE_UNSPECIFIED |
A predefinição é um tipo de Workspace não especificado. |
GOOGLE_DRIVE |
O arquivo de dados do Workspace contém dados do Drive |
GOOGLE_MAIL |
O arquivo de dados do Workspace contém dados de correio |
GOOGLE_SITES |
O armazenamento de dados do Workspace contém dados do Sites |
GOOGLE_CALENDAR |
O arquivo de dados do Workspace contém dados do Calendário |
GOOGLE_CHAT |
O arquivo de dados do Workspace contém dados do Chat |
GOOGLE_GROUPS |
O arquivo de dados do Workspace contém dados de grupos |
GOOGLE_KEEP |
O repositório de dados do Workspace contém dados do Keep |
GOOGLE_PEOPLE |
O arquivo de dados do Workspace contém dados de pessoas |
DocumentProcessingConfig
Um recurso singleton de DataStore
. Se estiver vazio quando DataStore
é criado e DataStore
estiver definido como DataStore.ContentConfig.CONTENT_REQUIRED
, o analisador predefinido é o analisador digital.
Representação JSON |
---|
{ "name": string, "chunkingConfig": { object ( |
Campos | |
---|---|
name |
O nome completo do recurso da configuração de processamento de documentos. Formato: |
chunkingConfig |
Se o modo de divisão em partes está ativado. |
defaultParsingConfig |
Configurações para o analisador de documentos predefinido. Se não for especificado, vamos configurá-lo como DigitalParsingConfig predefinido, e a configuração de análise predefinida será aplicada a todos os tipos de ficheiros para a análise de documentos. |
parsingConfigOverrides |
Mapeie do tipo de ficheiro para substituir a configuração de análise predefinida com base no tipo de ficheiro. Chaves suportadas:
|
ChunkingConfig
Configuração da configuração de divisão em partes.
Representação JSON |
---|
{ // Union field |
Campos | |
---|---|
Campo de união chunk_mode . Configurações adicionais que definem o comportamento da divisão em blocos. chunk_mode só pode ser uma das seguintes opções: |
|
layoutBasedChunkingConfig |
Configuração para a divisão em partes com base no esquema. |
LayoutBasedChunkingConfig
Configuração para a divisão em partes com base no esquema.
Representação JSON |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
Campos | |
---|---|
chunkSize |
O limite de tamanho dos tokens para cada fragmento. Valores suportados: 100 a 500 (inclusive). Valor predefinido: 500. |
includeAncestorHeadings |
Se deve incluir a anexação de diferentes níveis de títulos a blocos do meio do documento para evitar a perda de contexto. Valor predefinido: False. |
ParsingConfig
Configurações relacionadas aplicadas a um tipo específico de analisador de documentos.
Representação JSON |
---|
{ // Union field |
Campos | |
---|---|
Campo de união type_dedicated_config . Configurações para tipos de processamento de documentos. type_dedicated_config só pode ser uma das seguintes opções: |
|
digitalParsingConfig |
Configurações aplicadas ao analisador digital. |
ocrParsingConfig |
Configurações aplicadas ao analisador de OCR. Atualmente, aplica-se apenas a PDFs. |
layoutParsingConfig |
Configurações aplicadas ao analisador de esquemas. |
DigitalParsingConfig
Este tipo não tem campos.
As configurações de análise digital para documentos.
OcrParsingConfig
As configurações de análise de OCR para documentos.
Representação JSON |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
Campos | |
---|---|
enhancedDocumentElements[] |
[DEPRECATED] Este campo foi descontinuado. Para usar o processamento de elementos de documentos melhorados adicionais, mude para |
useNativeText |
Se for verdadeiro, usa texto nativo em vez de texto OCR em páginas que contenham texto nativo. |
LayoutParsingConfig
As configurações de análise de esquemas para documentos.
Representação JSON |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
Campos | |
---|---|
enableTableAnnotation |
Opcional. Se for verdadeiro, a anotação baseada no MDG é adicionada à tabela durante a análise. |
enableImageAnnotation |
Opcional. Se for verdadeiro, a anotação baseada no MDG é adicionada à imagem durante a análise. |
structuredContentTypes[] |
Opcional. Contém os tipos de estruturas necessários para extrair do documento. Valores suportados:
|
excludeHtmlElements[] |
Opcional. Lista de elementos HTML a excluir do conteúdo analisado. |
excludeHtmlClasses[] |
Opcional. Lista de classes HTML a excluir do conteúdo analisado. |
excludeHtmlIds[] |
Opcional. Lista de IDs HTML a excluir do conteúdo analisado. |
enableGetProcessedDocument |
Opcional. Se for verdadeiro, o documento processado é disponibilizado para a API GetProcessedDocument. |
HealthcareFhirConfig
Configuração para o armazenamento de dados para a vertical HEALTHCARE_FHIR
.
Representação JSON |
---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
Campos | |
---|---|
enableConfigurableSchema |
Se deve ativar o esquema configurável para o vertical Se estiver definido como |
enableStaticIndexingForBatchIngestion |
Se deve ativar a indexação estática para o carregamento em lote Se estiver definido como |
ServingConfigDataStore
Armazena informações relativas às configurações de publicação ao nível do DataStore.
Representação JSON |
---|
{ "disabledForServing": boolean } |
Campos | |
---|---|
disabledForServing |
Opcional. Se for definido como verdadeiro, o DataStore não vai estar disponível para publicar pedidos de pesquisa. |
ConfigurableBillingApproach
Configuração para uma abordagem de faturação configurável.
Enumerações | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Valor predefinido. Para o Spark e a abordagem de faturação não configurável não Spark. |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Use a base de subscrição + a faturação de excesso para a indexação do núcleo para armazenamento sem incorporação. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Use a faturação de consumo pré-paga para incorporar o suplemento de armazenamento. |
Métodos |
|
---|---|
|
Conclui a entrada do utilizador especificada com sugestões de palavras-chave. |
|
Cria um DataStore . |
|
Elimina um DataStore . |
|
Obtém um DataStore . |
|
Recebe o SiteSearchEngine . |
|
Apresenta todos os DataStore s associados ao projeto. |
|
Atualiza um DataStore |
|
Prepara um modelo personalizado. |