- Recurso: DataStore
- Representación JSON
- ContentConfig
- AdvancedSiteSearchConfig
- BillingEstimation
- WorkspaceConfig
- Tipo
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Métodos
Recurso: DataStore
DataStore captura la configuración y los parámetros globales a nivel de DataStore.
Representación JSON |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
Campos | |
---|---|
name |
Inmutable. Es el identificador. Es el nombre completo del recurso del almacén de datos. Formato: Este campo debe ser una cadena codificada en UTF-8 con un límite de longitud de 1,024 caracteres. |
displayName |
Obligatorio. Es el nombre visible del almacén de datos. Este campo debe ser una cadena codificada en UTF-8 con un límite de 128 caracteres. De lo contrario, se muestra un error INVALID_ARGUMENT. |
industryVertical |
Inmutable. Es la vertical de la industria en la que se registra el almacén de datos. |
solutionTypes[] |
Son las soluciones en las que se inscribe el almacén de datos. Soluciones disponibles para cada
|
defaultSchemaId |
Solo salida. Es el ID del |
contentConfig |
Inmutable. Es la configuración del contenido del almacén de datos. Si no se configura este campo, el comportamiento predeterminado del servidor será |
createTime |
Solo salida. Es la marca de tiempo en la que se creó el objeto Usa el formato RFC 3339, en el que el resultado generado siempre estará normalizado a Z y usará 0, 3, 6 o 9 dígitos fraccionarios. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
advancedSiteSearchConfig |
Opcional. Es la configuración para la búsqueda avanzada en el sitio. |
kmsKeyName |
Solo entrada. Es la clave de KMS que se usará para proteger este DataStore en el momento de la creación. Se debe configurar para las solicitudes que deben cumplir con las protecciones de la política de la organización de CMEK. Si este campo se configura y procesa correctamente, el DataStore estará protegido por la clave de KMS, como se indica en el campo cmekConfig. |
cmekConfig |
Solo salida. Es la información relacionada con la CMEK para el DataStore. |
billingEstimation |
Solo salida. Es una estimación del tamaño de los datos para la facturación. |
aclEnabled |
Inmutable. Indica si los datos de Cuando la LCA está habilitada para Actualmente, la LCA solo se admite en la vertical de la industria de |
workspaceConfig |
Es la configuración para almacenar la configuración del tipo de almacén de datos para los datos del espacio de trabajo. Se debe configurar cuando |
documentProcessingConfig |
Es la configuración para la comprensión y el enriquecimiento de documentos. |
startingSchema |
Es el esquema de inicio que se usará para este Este campo solo lo usa la API de El esquema proporcionado se validará según ciertas reglas del esquema. Obtén más información en este documento. |
healthcareFhirConfig |
Opcional. Es la configuración para la vertical de |
servingConfigDataStore |
Opcional. Almacena la configuración de la publicación a nivel de DataStore. |
identityMappingStore |
Inmutable. Es el nombre del recurso completamente calificado del |
isInfobotFaqDataStore |
Opcional. Si se configura, este DataStore es un DataStore de preguntas frecuentes de Infobot. |
configurableBillingApproach |
Opcional. Es la configuración para el enfoque de facturación configurable. Ver |
ContentConfig
Es la configuración del contenido del almacén de datos.
Enums | |
---|---|
CONTENT_CONFIG_UNSPECIFIED |
Valor predeterminado. |
NO_CONTENT |
Solo contiene documentos sin ningún Document.content . |
CONTENT_REQUIRED |
Solo contiene documentos con Document.content . |
PUBLIC_WEBSITE |
El almacén de datos se usa para la búsqueda de sitios web públicos. |
GOOGLE_WORKSPACE |
El almacén de datos se usa para la búsqueda en el espacio de trabajo. Los detalles del almacén de datos del espacio de trabajo se especifican en WorkspaceConfig . |
AdvancedSiteSearchConfig
Son los datos de configuración de la búsqueda avanzada en el sitio.
Representación JSON |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
Campos | |
---|---|
disableInitialIndex |
Si se establece como verdadero, se inhabilita la indexación inicial para DataStore. |
disableAutomaticRefresh |
Si se establece como verdadero, se inhabilita la actualización automática para DataStore. |
BillingEstimation
Es una estimación del tamaño de los datos por almacén de datos.
Representación JSON |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
Campos | |
---|---|
structuredDataSize |
Tamaño de los datos estructurados en bytes. |
unstructuredDataSize |
Tamaño de los datos no estructurados en bytes. |
websiteDataSize |
Tamaño de los datos de los sitios web en bytes. |
structuredDataUpdateTime |
Es la marca de tiempo de la última actualización de los datos estructurados. Usa el formato RFC 3339, en el que el resultado generado siempre estará normalizado a Z y usará 0, 3, 6 o 9 dígitos fraccionarios. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
unstructuredDataUpdateTime |
Es la marca de tiempo de la última actualización de los datos no estructurados. Usa el formato RFC 3339, en el que el resultado generado siempre estará normalizado a Z y usará 0, 3, 6 o 9 dígitos fraccionarios. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
websiteDataUpdateTime |
Es la marca de tiempo de la última actualización de los sitios web. Usa el formato RFC 3339, en el que el resultado generado siempre estará normalizado a Z y usará 0, 3, 6 o 9 dígitos fraccionarios. También se aceptan otras compensaciones que no sean “Z”. Ejemplos: |
WorkspaceConfig
Configuración para almacenar la configuración del tipo de almacén de datos para los datos del espacio de trabajo
Representación JSON |
---|
{
"type": enum ( |
Campos | |
---|---|
type |
Es la fuente de datos de Google Workspace. |
dasherCustomerId |
Es el ID de cliente de Dasher ofuscado. |
superAdminServiceAccount |
Opcional. Es la cuenta de servicio de administrador avanzado del espacio de trabajo que se usará para generar el token de acceso. Por el momento, solo lo usamos para la transferencia de datos del conector nativo de Google Drive. |
superAdminEmailAddress |
Opcional. Es la dirección de correo electrónico del administrador avanzado del espacio de trabajo que se usará para generar el token de acceso. Por el momento, solo lo usamos para la transferencia de datos del conector nativo de Google Drive. |
Tipo
Especifica el tipo de app de Workspace que admite este DataStore.
Enums | |
---|---|
TYPE_UNSPECIFIED |
El valor predeterminado es un tipo de Workspace no especificado. |
GOOGLE_DRIVE |
El almacén de datos de Workspace contiene datos de Drive |
GOOGLE_MAIL |
El almacén de datos de Workspace contiene datos de correo |
GOOGLE_SITES |
El almacén de datos de Workspace contiene datos de Sites |
GOOGLE_CALENDAR |
El almacén de datos de Workspace contiene datos del Calendario |
GOOGLE_CHAT |
El almacén de datos de Workspace contiene datos de Chat |
GOOGLE_GROUPS |
El almacén de datos de Workspace contiene datos de Grupos |
GOOGLE_KEEP |
El almacén de datos de Workspace contiene datos de Keep |
GOOGLE_PEOPLE |
El almacén de datos de Workspace contiene datos de personas |
DocumentProcessingConfig
Es un recurso singleton de DataStore
. Si está vacío cuando se crea DataStore
y DataStore
se establece en DataStore.ContentConfig.CONTENT_REQUIRED
, el analizador predeterminado se establecerá de forma predeterminada en el analizador digital.
Representación JSON |
---|
{ "name": string, "chunkingConfig": { object ( |
Campos | |
---|---|
name |
Es el nombre completo del recurso de la configuración de procesamiento de documentos. Formato: |
chunkingConfig |
Indica si el modo de fragmentación está habilitado. |
defaultParsingConfig |
Es la configuración del analizador de documentos predeterminado. Si no se especifica, lo configuraremos como DigitalParsingConfig predeterminado, y la configuración de análisis predeterminada se aplicará a todos los tipos de archivos para el análisis de documentos. |
parsingConfigOverrides |
Es un mapa del tipo de archivo para anular la configuración de análisis predeterminada según el tipo de archivo. Claves admitidas:
|
ChunkingConfig
Es la configuración de la configuración de fragmentación.
Representación JSON |
---|
{ // Union field |
Campos | |
---|---|
Campo de unión chunk_mode . Es la configuración adicional que define el comportamiento de la división en fragmentos. chunk_mode puede ser solo uno de los siguientes: |
|
layoutBasedChunkingConfig |
Es la configuración para la división en fragmentos basada en el diseño. |
LayoutBasedChunkingConfig
Es la configuración para la división en fragmentos basada en el diseño.
Representación JSON |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
Campos | |
---|---|
chunkSize |
Es el límite de tamaño de token para cada fragmento. Valores admitidos: de 100 a 500 (inclusive). El valor predeterminado es 500. |
includeAncestorHeadings |
Indica si se deben agregar diferentes niveles de encabezados a los fragmentos del medio del documento para evitar la pérdida de contexto. El valor predeterminado es False. |
ParsingConfig
Son parámetros de configuración relacionados que se aplican a un tipo específico de analizador de documentos.
Representación JSON |
---|
{ // Union field |
Campos | |
---|---|
Campo de unión type_dedicated_config . Son parámetros de configuración para los tipos de procesamiento de documentos. type_dedicated_config puede ser solo uno de los siguientes: |
|
digitalParsingConfig |
Son las configuraciones que se aplican al analizador digital. |
ocrParsingConfig |
Son las configuraciones que se aplican al analizador de OCR. Actualmente, solo se aplica a los archivos PDF. |
layoutParsingConfig |
Son las configuraciones que se aplican al analizador de diseños. |
DigitalParsingConfig
Este tipo no tiene campos.
Son los parámetros de configuración de análisis digital para documentos.
OcrParsingConfig
Son los parámetros de configuración del análisis de OCR para documentos.
Representación JSON |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
Campos | |
---|---|
enhancedDocumentElements[] |
[OBSOLETO] Este campo ya no está disponible. Para usar el procesamiento adicional de elementos de documentos mejorados, cambia a |
useNativeText |
Si es verdadero, se usará el texto nativo en lugar del texto de OCR en las páginas que contengan texto nativo. |
LayoutParsingConfig
Son los parámetros de configuración del análisis de diseño para documentos.
Representación JSON |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
Campos | |
---|---|
enableTableAnnotation |
Opcional. Si es verdadero, se agrega la anotación basada en LLM a la tabla durante el análisis. |
enableImageAnnotation |
Opcional. Si es verdadero, se agrega la anotación basada en LLM a la imagen durante el análisis. |
structuredContentTypes[] |
Opcional. Contiene los tipos de estructura requeridos para extraer del documento. Valores admitidos:
|
excludeHtmlElements[] |
Opcional. Lista de elementos HTML que se excluirán del contenido analizado. |
excludeHtmlClasses[] |
Opcional. Lista de clases HTML que se excluirán del contenido analizado. |
excludeHtmlIds[] |
Opcional. Lista de IDs de HTML que se excluirán del contenido analizado. |
enableGetProcessedDocument |
Opcional. Si es verdadero, el documento procesado estará disponible para la API de GetProcessedDocument. |
HealthcareFhirConfig
Es la configuración del almacén de datos para la vertical de HEALTHCARE_FHIR
.
Representación JSON |
---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
Campos | |
---|---|
enableConfigurableSchema |
Indica si se debe habilitar el esquema configurable para la vertical de Si se configura como |
enableStaticIndexingForBatchIngestion |
Indica si se debe habilitar la indexación estática para la transferencia por lotes de Si se configura como |
ServingConfigDataStore
Almacena información sobre la configuración de la publicación a nivel de DataStore.
Representación JSON |
---|
{ "disabledForServing": boolean } |
Campos | |
---|---|
disabledForServing |
Opcional. Si se establece como verdadero, DataStore no estará disponible para atender solicitudes de búsqueda. |
ConfigurableBillingApproach
Es la configuración para el enfoque de facturación configurable.
Enums | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Valor predeterminado. Es el enfoque de facturación no configurable para Spark y no Spark. |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Usar la facturación de suscripción base más excedente para la indexación principal del almacenamiento que no es de incorporación |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Usa la facturación de pago por uso de consumo para el complemento de almacenamiento de incorporación. |
Métodos |
|
---|---|
|
Completa la entrada del usuario especificada con sugerencias de palabras clave. |
|
Crea un DataStore . |
|
Borra un DataStore . |
|
Obtienes una DataStore . |
|
Obtiene el SiteSearchEngine . |
|
Enumera todos los DataStore asociados al proyecto. |
|
Actualiza un DataStore |
|
Entrena un modelo personalizado. |