- Recurso: DataStore
- Representação JSON
- ContentConfig
- AdvancedSiteSearchConfig
- BillingEstimation
- WorkspaceConfig
- Tipo
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Métodos
Recurso: DataStore
O DataStore captura configurações globais no nível do DataStore.
Representação JSON |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
Campos | |
---|---|
name |
Imutável. Identificador. O nome completo do recurso do repositório de dados. Formato: Este campo precisa ser uma string codificada em UTF-8 com um limite de 1.024 caracteres. |
displayName |
Obrigatório. O nome de exibição do repositório de dados. Esse campo precisa ser uma string codificada em UTF-8 com um limite de 128 caracteres. Caso contrário, um erro INVALID_ARGUMENT será retornado. |
industryVertical |
Imutável. O setor em que o repositório de dados está registrado. |
solutionTypes[] |
As soluções registradas pelo repositório de dados. Soluções disponíveis para cada
|
defaultSchemaId |
Apenas saída. O ID do |
contentConfig |
Imutável. A configuração de conteúdo do repositório de dados. Se esse campo não for definido, o comportamento padrão do servidor será |
createTime |
Apenas saída. Carimbo de data/hora em que o Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
advancedSiteSearchConfig |
Opcional. Configuração para pesquisa avançada no site. |
kmsKeyName |
Somente entrada. A chave do KMS a ser usada para proteger este DataStore no momento da criação. Precisa ser definido para solicitações que precisam obedecer às proteções da política da organização da CMEK. Se esse campo for definido e processado com sucesso, o DataStore será protegido pela chave do KMS, conforme indicado no campo "cmekConfig". |
cmekConfig |
Apenas saída. Informações relacionadas à CMEK para o DataStore. |
billingEstimation |
Apenas saída. Estimativa do tamanho dos dados para faturamento. |
aclEnabled |
Imutável. Se os dados em Quando a ACL está ativada para o No momento, as ACLs são aceitas apenas na categoria |
workspaceConfig |
Configuração para armazenar a configuração do tipo de repositório de dados para dados do espaço de trabalho. Isso precisa ser definido quando |
documentProcessingConfig |
Configuração para entendimento e enriquecimento de documentos. |
startingSchema |
O esquema inicial a ser usado para este Esse campo é usado apenas pela API O esquema fornecido será validado de acordo com determinadas regras. Saiba mais neste documento. |
healthcareFhirConfig |
Opcional. Configuração para a categoria |
servingConfigDataStore |
Opcional. Armazena a configuração de veiculação no nível do DataStore. |
identityMappingStore |
Imutável. O nome totalmente qualificado do recurso do |
isInfobotFaqDataStore |
Opcional. Se definido, esse DataStore será um DataStore de perguntas frequentes do Infobot. |
configurableBillingApproach |
Opcional. Configuração para uma abordagem de faturamento configurável. Ver |
ContentConfig
Configuração de conteúdo do repositório de dados.
Tipos enumerados | |
---|---|
CONTENT_CONFIG_UNSPECIFIED |
Valor padrão. |
NO_CONTENT |
Contém apenas documentos sem Document.content . |
CONTENT_REQUIRED |
Contém apenas documentos com Document.content . |
PUBLIC_WEBSITE |
O repositório de dados é usado para pesquisa pública de sites. |
GOOGLE_WORKSPACE |
O repositório de dados é usado para a pesquisa no espaço de trabalho. Os detalhes do repositório de dados do espaço de trabalho são especificados no WorkspaceConfig . |
AdvancedSiteSearchConfig
Dados de configuração para pesquisa avançada no site.
Representação JSON |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
Campos | |
---|---|
disableInitialIndex |
Se definido como verdadeiro, a indexação inicial será desativada para o DataStore. |
disableAutomaticRefresh |
Se definido como verdadeiro, a atualização automática será desativada para o DataStore. |
BillingEstimation
Estimativa do tamanho dos dados por repositório de dados.
Representação JSON |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
Campos | |
---|---|
structuredDataSize |
Tamanho dos dados estruturados em bytes. |
unstructuredDataSize |
Tamanho dos dados não estruturados em bytes. |
websiteDataSize |
Tamanho dos dados para sites em bytes. |
structuredDataUpdateTime |
Carimbo de data/hora da última atualização dos dados estruturados. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
unstructuredDataUpdateTime |
Carimbo de data/hora da última atualização de dados não estruturados. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
websiteDataUpdateTime |
Carimbo de data/hora da última atualização de sites. Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de Z, outros ajustes também são aceitos. Exemplos: |
WorkspaceConfig
Configuração para armazenar a configuração do tipo de repositório de dados para dados do espaço de trabalho.
Representação JSON |
---|
{
"type": enum ( |
Campos | |
---|---|
type |
A fonte de dados do Google Workspace. |
dasherCustomerId |
ID de cliente Dasher ofuscado. |
superAdminServiceAccount |
Opcional. A conta de serviço de superadministrador do espaço de trabalho que será usada para gerar tokens de acesso. Por enquanto, só usamos para ingestão de dados do conector nativo do Google Drive. |
superAdminEmailAddress |
Opcional. O endereço de e-mail do superadministrador do espaço de trabalho que será usado para gerar o token de acesso. Por enquanto, só usamos para ingestão de dados do conector nativo do Google Drive. |
Tipo
Especifica o tipo de app do Workspace compatível com este DataStore.
Tipos enumerados | |
---|---|
TYPE_UNSPECIFIED |
O padrão é um tipo de espaço de trabalho não especificado. |
GOOGLE_DRIVE |
O repositório de dados do Workspace contém dados do Drive |
GOOGLE_MAIL |
O repositório de dados do Workspace contém dados de e-mail |
GOOGLE_SITES |
O repositório de dados do Workspace contém dados do Sites |
GOOGLE_CALENDAR |
Repositório de dados do Workspace contém dados da Agenda |
GOOGLE_CHAT |
O repositório de dados do Workspace contém dados do Chat |
GOOGLE_GROUPS |
Repositório de dados do Workspace contém dados de grupos |
GOOGLE_KEEP |
O repositório de dados do Workspace contém dados do Keep |
GOOGLE_PEOPLE |
O repositório de dados do Workspace contém dados de pessoas |
DocumentProcessingConfig
Um recurso singleton de DataStore
. Se ele estiver vazio quando DataStore
for criado e DataStore
estiver definido como DataStore.ContentConfig.CONTENT_REQUIRED
, o analisador padrão será definido como o analisador digital.
Representação JSON |
---|
{ "name": string, "chunkingConfig": { object ( |
Campos | |
---|---|
name |
O nome completo do recurso da configuração de processamento de documentos. Formato: |
chunkingConfig |
Se o modo de divisão em partes está ativado. |
defaultParsingConfig |
Configurações para o analisador de documentos padrão. Se não for especificado, vamos configurá-lo como DigitalParsingConfig padrão, e a configuração de análise padrão será aplicada a todos os tipos de arquivo para análise de documentos. |
parsingConfigOverrides |
Mapeamento do tipo de arquivo para substituir a configuração de análise padrão com base no tipo de arquivo. Chaves compatíveis:
|
ChunkingConfig
Configuração para a configuração de divisão.
Representação JSON |
---|
{ // Union field |
Campos | |
---|---|
Campo de união chunk_mode . Configurações adicionais que definem o comportamento do chunking. chunk_mode pode ser apenas de um dos tipos a seguir: |
|
layoutBasedChunkingConfig |
Configuração para o chunking baseado em layout. |
LayoutBasedChunkingConfig
Configuração para o chunking baseado em layout.
Representação JSON |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
Campos | |
---|---|
chunkSize |
O limite de tamanho de token para cada bloco. Valores aceitos: de 100 a 500 (inclusive). Valor padrão: 500. |
includeAncestorHeadings |
Se é necessário incluir diferentes níveis de títulos em blocos do meio do documento para evitar a perda de contexto. Valor padrão: False. |
ParsingConfig
Configurações relacionadas aplicadas a um tipo específico de analisador de documentos.
Representação JSON |
---|
{ // Union field |
Campos | |
---|---|
Campo de união type_dedicated_config . Configurações para tipos de processamento de documentos. type_dedicated_config pode ser apenas de um dos tipos a seguir: |
|
digitalParsingConfig |
Configurações aplicadas ao analisador digital. |
ocrParsingConfig |
Configurações aplicadas ao analisador de OCR. No momento, isso só se aplica a PDFs. |
layoutParsingConfig |
Configurações aplicadas ao analisador de layout. |
DigitalParsingConfig
Esse tipo não tem campos.
As configurações de análise digital para documentos.
OcrParsingConfig
As configurações de análise de OCR para documentos.
Representação JSON |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
Campos | |
---|---|
enhancedDocumentElements[] |
[DESCONTINUADO] O uso deste campo foi descontinuado. Para usar o processamento adicional de elementos de documentos otimizado, mude para |
useNativeText |
Se for verdadeiro, vai usar texto nativo em vez de texto de OCR em páginas que contêm texto nativo. |
LayoutParsingConfig
As configurações de análise de layout para documentos.
Representação JSON |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
Campos | |
---|---|
enableTableAnnotation |
Opcional. Se for verdadeiro, a anotação baseada em LLM será adicionada à tabela durante a análise. |
enableImageAnnotation |
Opcional. Se for verdadeiro, a anotação baseada em LLM será adicionada à imagem durante a análise. |
structuredContentTypes[] |
Opcional. Contém os tipos de estrutura necessários para extrair do documento. Valores aceitos:
|
excludeHtmlElements[] |
Opcional. Lista de elementos HTML a serem excluídos do conteúdo analisado. |
excludeHtmlClasses[] |
Opcional. Lista de classes HTML a serem excluídas do conteúdo analisado. |
excludeHtmlIds[] |
Opcional. Lista de IDs HTML a serem excluídos do conteúdo analisado. |
enableGetProcessedDocument |
Opcional. Se for "true", o documento processado será disponibilizado para a API GetProcessedDocument. |
HealthcareFhirConfig
Configuração para repositório de dados da categoria HEALTHCARE_FHIR
.
Representação JSON |
---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
Campos | |
---|---|
enableConfigurableSchema |
Se o esquema configurável para a vertical Se definido como |
enableStaticIndexingForBatchIngestion |
Define se a indexação estática para a ingestão em lote de Se definido como |
ServingConfigDataStore
Armazena informações sobre as configurações de exibição no nível do DataStore.
Representação JSON |
---|
{ "disabledForServing": boolean } |
Campos | |
---|---|
disabledForServing |
Opcional. Se definido como verdadeiro, o DataStore não estará disponível para atender a solicitações de pesquisa. |
ConfigurableBillingApproach
Configuração para uma abordagem de faturamento configurável.
Tipos enumerados | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Valor padrão. Para o Spark e a abordagem de faturamento não configurável que não é do Spark. |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Use o faturamento de base + excedente da assinatura para indexação principal para armazenamento sem incorporação. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Use o faturamento de pagamento por uso para o complemento de armazenamento de incorporação. |
Métodos |
|
---|---|
|
Completa a entrada do usuário especificada com sugestões de palavras-chave. |
|
Cria uma DataStore . |
|
Exclui um DataStore . |
|
Recebe um DataStore . |
|
Recebe o SiteSearchEngine . |
|
Lista todos os DataStore s associados ao projeto. |
|
Atualiza um DataStore |
|
Treina um modelo personalizado. |