- Recurso: DataStore
- Representación JSON
- ContentConfig
- AdvancedSiteSearchConfig
- LanguageInfo
- NaturalLanguageQueryUnderstandingConfig
- Modo
- BillingEstimation
- WorkspaceConfig
- Tipo
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Métodos
Recurso: DataStore
DataStore captura los ajustes y las configuraciones globales a nivel de DataStore.
Representación JSON |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
Campos | |
---|---|
name |
Inmutable. Identificador. Nombre de recurso completo del almacén de datos. Formato: Este campo debe ser una cadena codificada en UTF-8 con un límite de 1024 caracteres. |
displayName |
Obligatorio. Nombre visible del almacén de datos. Este campo debe ser una cadena codificada en UTF-8 con un límite de 128 caracteres. De lo contrario, se devuelve un error INVALID_ARGUMENT. |
industryVertical |
Inmutable. El vertical del sector en el que se registra el almacén de datos. |
solutionTypes[] |
Las soluciones en las que se registra el almacén de datos. Soluciones disponibles para cada
|
defaultSchemaId |
Solo de salida. ID del |
contentConfig |
Inmutable. La configuración de contenido del almacén de datos. Si no se define este campo, el comportamiento predeterminado del servidor será |
createTime |
Solo de salida. Marca de tiempo de la creación de Usa RFC 3339, donde la salida generada siempre se normaliza con Z y usa 0, 3, 6 o 9 dígitos fraccionarios. También se aceptan otros desplazamientos distintos de "Z". Ejemplos: |
advancedSiteSearchConfig |
Opcional. Configuración de la búsqueda avanzada en el sitio. |
languageInfo |
Información de idioma de DataStore. |
naturalLanguageQueryUnderstandingConfig |
Opcional. Configuración de la comprensión de consultas en lenguaje natural. |
kmsKeyName |
Solo de entrada. Clave de KMS que se usará para proteger este almacén de datos en el momento de la creación. Se debe definir en las solicitudes que deban cumplir las protecciones de la política de organización de CMEK. Si este campo se define y se procesa correctamente, el almacén de datos estará protegido por la clave de KMS, tal como se indica en el campo cmekConfig. |
cmekConfig |
Solo de salida. Información relacionada con CMEK de DataStore. |
billingEstimation |
Solo de salida. Estimación del tamaño de los datos para la facturación. |
aclEnabled |
Inmutable. Si los datos de Cuando la ACL está habilitada para Actualmente, las listas de control de acceso solo se admiten en el vertical de la industria |
workspaceConfig |
Configuración para almacenar la configuración del tipo de almacén de datos de los datos del espacio de trabajo. Este valor debe definirse cuando |
documentProcessingConfig |
Configuración de la comprensión y el enriquecimiento de documentos. |
startingSchema |
El esquema de inicio que se usará para este Este campo solo lo usa la API El esquema proporcionado se validará según determinadas reglas del esquema. Consulta más información en este documento. |
healthcareFhirConfig |
Opcional. Configuración de la vertical |
servingConfigDataStore |
Opcional. Almacena la configuración de servicio a nivel de DataStore. |
identityMappingStore |
Inmutable. Nombre de recurso completo del |
isInfobotFaqDataStore |
Opcional. Si se define, este DataStore es un DataStore de preguntas frecuentes de Infobot. |
configurableBillingApproach |
Opcional. Configuración del método de facturación configurable. Consulta |
ContentConfig
Configuración del contenido del almacén de datos.
Enumeraciones | |
---|---|
CONTENT_CONFIG_UNSPECIFIED |
Valor predeterminado. |
NO_CONTENT |
Solo contiene documentos sin Document.content . |
CONTENT_REQUIRED |
Solo contiene documentos con Document.content . |
PUBLIC_WEBSITE |
El almacén de datos se usa para la búsqueda en sitios web públicos. |
GOOGLE_WORKSPACE |
El almacén de datos se usa para la búsqueda en el espacio de trabajo. Los detalles del almacén de datos del espacio de trabajo se especifican en los WorkspaceConfig . |
AdvancedSiteSearchConfig
Datos de configuración de la búsqueda avanzada en el sitio.
Representación JSON |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
Campos | |
---|---|
disableInitialIndex |
Si se le asigna el valor true, se inhabilita la indexación inicial de DataStore. |
disableAutomaticRefresh |
Si se le asigna el valor true, se inhabilita la actualización automática de DataStore. |
LanguageInfo
Información de idioma de DataStore.
Representación JSON |
---|
{ "languageCode": string, "normalizedLanguageCode": string, "language": string, "region": string } |
Campos | |
---|---|
languageCode |
Código de idioma de DataStore. |
normalizedLanguageCode |
Solo de salida. Es la forma normalizada de languageCode. Por ejemplo, los códigos de idioma |
language |
Solo de salida. Parte del idioma de normalizedLanguageCode. E.g.: |
region |
Solo de salida. Parte de la región de normalizedLanguageCode, si está presente. E.g.: |
NaturalLanguageQueryUnderstandingConfig
Configuración de la comprensión de consultas en lenguaje natural.
Representación JSON |
---|
{
"mode": enum ( |
Campos | |
---|---|
mode |
Modo de comprensión de consultas en lenguaje natural. Si no se define este campo, el comportamiento predeterminado será |
Modo
Modo de comprensión de consultas en lenguaje natural. Si NaturalLanguageQueryUnderstandingConfig.Mode es ENABLED, las funciones de comprensión del lenguaje natural se habilitarán en una solicitud de búsqueda si NaturalLanguageQueryUnderstandingSpec.FilterExtractionCondition en SearchRequest es ENABLED.
Enumeraciones | |
---|---|
MODE_UNSPECIFIED |
Valor predeterminado. |
DISABLED |
La comprensión de consultas en lenguaje natural está inhabilitada. |
ENABLED |
La comprensión de consultas en lenguaje natural está habilitada. |
BillingEstimation
Estimación del tamaño de los datos por almacén de datos.
Representación JSON |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
Campos | |
---|---|
structuredDataSize |
Tamaño de los datos estructurados en bytes. |
unstructuredDataSize |
Tamaño de los datos sin estructurar en bytes. |
websiteDataSize |
Tamaño de los datos de los sitios web en bytes. |
structuredDataUpdateTime |
Marca de tiempo de la última actualización de los datos estructurados. Usa RFC 3339, donde la salida generada siempre se normaliza con Z y usa 0, 3, 6 o 9 dígitos fraccionarios. También se aceptan otros desplazamientos distintos de "Z". Ejemplos: |
unstructuredDataUpdateTime |
Marca de tiempo de la última actualización de los datos sin estructurar. Usa RFC 3339, donde la salida generada siempre se normaliza con Z y usa 0, 3, 6 o 9 dígitos fraccionarios. También se aceptan otros desplazamientos distintos de "Z". Ejemplos: |
websiteDataUpdateTime |
Marca de tiempo de la última actualización de los sitios web. Usa RFC 3339, donde la salida generada siempre se normaliza con Z y usa 0, 3, 6 o 9 dígitos fraccionarios. También se aceptan otros desplazamientos distintos de "Z". Ejemplos: |
WorkspaceConfig
Configuración para almacenar la configuración del tipo de almacén de datos de los datos del espacio de trabajo.
Representación JSON |
---|
{
"type": enum ( |
Campos | |
---|---|
type |
La fuente de datos de Google Workspace. |
dasherCustomerId |
ID de cliente de Dasher ofuscado. |
superAdminServiceAccount |
Opcional. La cuenta de servicio de superadministrador del espacio de trabajo que se usará para generar tokens de acceso. Por ahora, solo lo usamos para la ingestión de datos del conector de Google Drive nativo. |
superAdminEmailAddress |
Opcional. La dirección de correo del superadministrador del espacio de trabajo que se usará para generar el token de acceso. Por ahora, solo lo usamos para la ingestión de datos del conector de Google Drive nativo. |
Tipo
Especifica el tipo de aplicación de Workspace compatible con este almacén de datos.
Enumeraciones | |
---|---|
TYPE_UNSPECIFIED |
El valor predeterminado es un tipo de espacio de trabajo sin especificar. |
GOOGLE_DRIVE |
El almacén de datos de Workspace contiene datos de Drive |
GOOGLE_MAIL |
El almacén de datos de Workspace contiene datos de correo |
GOOGLE_SITES |
El almacén de datos de Workspace contiene datos de Sites |
GOOGLE_CALENDAR |
El almacén de datos de Workspace contiene datos de Calendar |
GOOGLE_CHAT |
El almacén de datos de Workspace contiene datos de Chat |
GOOGLE_GROUPS |
El almacén de datos de Workspace contiene datos de Grupos |
GOOGLE_KEEP |
El almacén de datos de Workspace contiene datos de Keep |
GOOGLE_PEOPLE |
El almacén de datos de Workspace contiene datos de personas |
DocumentProcessingConfig
Un recurso singleton de DataStore
. Si está vacío cuando se crea DataStore
y DataStore
se define como DataStore.ContentConfig.CONTENT_REQUIRED
, el analizador predeterminado se convertirá en el analizador digital.
Representación JSON |
---|
{ "name": string, "chunkingConfig": { object ( |
Campos | |
---|---|
name |
Nombre completo del recurso DocumentProcessingConfig. Formato: |
chunkingConfig |
Indica si el modo de fragmentación está habilitado. |
defaultParsingConfig |
Configuraciones del analizador de documentos predeterminado. Si no se especifica, se configurará como DigitalParsingConfig predeterminado y se aplicará a todos los tipos de archivo para el análisis de documentos. |
parsingConfigOverrides |
Asigna un tipo de archivo para anular la configuración de análisis predeterminada en función del tipo de archivo. Claves admitidas:
|
ChunkingConfig
Configuración de la configuración de fragmentación.
Representación JSON |
---|
{ // Union field |
Campos | |
---|---|
Campo de unión chunk_mode . Configuraciones adicionales que definen el comportamiento de la fragmentación. chunk_mode solo puede ser una de estas dos opciones: |
|
layoutBasedChunkingConfig |
Configuración de la fragmentación basada en el diseño. |
LayoutBasedChunkingConfig
Configuración de la fragmentación basada en el diseño.
Representación JSON |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
Campos | |
---|---|
chunkSize |
El límite de tamaño de los tokens de cada fragmento. Valores admitidos: de 100 a 500 (inclusive). Valor predeterminado: 500. |
includeAncestorHeadings |
Indica si se deben añadir diferentes niveles de encabezados a los fragmentos desde la mitad del documento para evitar la pérdida de contexto. Valor predeterminado: False. |
ParsingConfig
Configuraciones relacionadas que se aplican a un tipo específico de analizador de documentos.
Representación JSON |
---|
{ // Union field |
Campos | |
---|---|
Campo de unión type_dedicated_config . Configuraciones de los tipos de procesamiento de documentos. type_dedicated_config solo puede ser una de estas dos opciones: |
|
digitalParsingConfig |
Configuraciones aplicadas al analizador digital. |
ocrParsingConfig |
Configuraciones aplicadas al analizador de OCR. Actualmente, solo se aplica a los PDFs. |
layoutParsingConfig |
Configuraciones aplicadas al analizador de diseño. |
DigitalParsingConfig
Este tipo no tiene campos.
Las configuraciones de análisis digital de documentos.
OcrParsingConfig
Configuraciones de análisis de OCR para documentos.
Representación JSON |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
Campos | |
---|---|
enhancedDocumentElements[] |
[DEPRECATED] Este campo está obsoleto. Para usar el procesamiento mejorado adicional de elementos de documentos, cambia a |
useNativeText |
Si se le asigna el valor true, se usará el texto nativo en lugar del texto de OCR en las páginas que contengan texto nativo. |
LayoutParsingConfig
Las configuraciones de análisis de diseño de los documentos.
Representación JSON |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
Campos | |
---|---|
enableTableAnnotation |
Opcional. Si es true, la anotación basada en LLM se añade a la tabla durante el análisis. |
enableImageAnnotation |
Opcional. Si es true, la anotación basada en LLM se añade a la imagen durante el análisis. |
structuredContentTypes[] |
Opcional. Contiene los tipos de estructura necesarios para extraerlos del documento. Valores admitidos:
|
excludeHtmlElements[] |
Opcional. Lista de elementos HTML que se excluirán del contenido analizado. |
excludeHtmlClasses[] |
Opcional. Lista de clases HTML que se excluirán del contenido analizado. |
excludeHtmlIds[] |
Opcional. Lista de IDs de HTML que se excluirán del contenido analizado. |
enableGetProcessedDocument |
Opcional. Si es true, el documento procesado estará disponible para la API GetProcessedDocument. |
HealthcareFhirConfig
Configuración del almacén de datos de la vertical HEALTHCARE_FHIR
.
Representación JSON |
---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
Campos | |
---|---|
enableConfigurableSchema |
Indica si se debe habilitar el esquema configurable para la vertical Si se define como |
enableStaticIndexingForBatchIngestion |
Indica si se debe habilitar la indexación estática para la ingestión por lotes de Si se define como |
ServingConfigDataStore
Almacena información sobre las configuraciones de publicación a nivel de DataStore.
Representación JSON |
---|
{ "disabledForServing": boolean } |
Campos | |
---|---|
disabledForServing |
Opcional. Si se define como true, DataStore no estará disponible para atender solicitudes de búsqueda. |
ConfigurableBillingApproach
Configuración del método de facturación configurable.
Enumeraciones | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Valor predeterminado. Enfoque de facturación no configurable para Spark y no Spark. |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Usa la base de suscripción + la facturación por exceso para indexar el almacenamiento principal que no es de inserciones. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Usa la facturación por consumo para el complemento de almacenamiento insertado. |
Métodos |
|
---|---|
|
Completa la información introducida por el usuario con sugerencias de palabras clave. |
|
Crea un DataStore . |
|
Elimina un DataStore . |
|
Obtiene un DataStore . |
|
Obtiene el SiteSearchEngine . |
|
Lista todos los DataStore s asociados al proyecto. |
|
Actualiza un DataStore |
|
Entrena un modelo personalizado. |