- Ressource : DataStore
- Représentation JSON
- ContentConfig
- AdvancedSiteSearchConfig
- BillingEstimation
- WorkspaceConfig
- Type
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Méthodes
Ressource : DataStore
DataStore capture les paramètres et configurations globaux au niveau DataStore.
Représentation JSON |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
Champs | |
---|---|
name |
Immuable. Identifiant. Nom complet de la ressource du data store. Format : Ce champ doit être une chaîne encodée au format UTF-8, dont la longueur ne doit pas dépasser 1 024 caractères. |
displayName |
Obligatoire. Nom à afficher du data store. Ce champ doit être une chaîne encodée au format UTF-8 et ne doit pas dépasser 128 caractères. Dans le cas contraire, une erreur INVALID_ARGUMENT est renvoyée. |
industryVertical |
Immuable. Secteur d'activité auquel le data store est associé. |
solutionTypes[] |
Solutions auxquelles le data store est inscrit. Solutions disponibles pour chaque
|
defaultSchemaId |
Uniquement en sortie. ID de l' |
contentConfig |
Immuable. Configuration du contenu du data store. Si ce champ n'est pas défini, le comportement du serveur est défini par défaut sur |
createTime |
Uniquement en sortie. Code temporel de création de Utilise la norme RFC 3339, où la sortie générée utilise toujours le format UTC (indiqué par "Z" pour le temps universel coordonné) avec des secondes fractionnaires de 0, 3, 6 ou 9 chiffres décimaux. Des décalages horaires autres que "Z" (UTC) sont également acceptés. Exemples : |
advancedSiteSearchConfig |
Facultatif. Configuration de la recherche avancée sur le site. |
kmsKeyName |
Uniquement en entrée. Clé KMS à utiliser pour protéger ce DataStore lors de sa création. Doit être défini pour les requêtes qui doivent respecter les protections des règles d'administration CMEK. Si ce champ est défini et traité correctement, le DataStore sera protégé par la clé KMS, comme indiqué dans le champ cmekConfig. |
cmekConfig |
Uniquement en sortie. Informations liées à CMEK pour DataStore. |
billingEstimation |
Uniquement en sortie. Estimation de la taille des données pour la facturation. |
aclEnabled |
Immuable. Indique si les données de Lorsque la LCA est activée pour Actuellement, les LCA ne sont compatibles qu'avec le secteur |
workspaceConfig |
Configuration permettant de stocker la configuration du type de data store pour les données de l'espace de travail. Ce paramètre doit être défini lorsque |
documentProcessingConfig |
Configuration pour la compréhension et l'enrichissement des documents. |
startingSchema |
Schéma de début à utiliser pour ce Ce champ n'est utilisé que par l'API Le schéma fourni sera validé par rapport à certaines règles. Pour en savoir plus, consultez ce document. |
healthcareFhirConfig |
Facultatif. Configuration pour le secteur |
servingConfigDataStore |
Facultatif. Stocke la configuration de diffusion au niveau du DataStore. |
identityMappingStore |
Immuable. Nom complet de la ressource |
isInfobotFaqDataStore |
Facultatif. Si cette valeur est définie, ce DataStore est un DataStore de questions fréquentes Infobot. |
configurableBillingApproach |
Facultatif. Configuration de l'approche de facturation configurable. Vous devriez voir ce qui suit : |
ContentConfig
Configuration du contenu du data store.
Enums | |
---|---|
CONTENT_CONFIG_UNSPECIFIED |
Valeur par défaut. |
NO_CONTENT |
Ne contient que des documents sans Document.content . |
CONTENT_REQUIRED |
Ne contient que les documents avec Document.content . |
PUBLIC_WEBSITE |
Le data store est utilisé pour la recherche sur les sites Web publics. |
GOOGLE_WORKSPACE |
Le data store est utilisé pour la recherche dans l'espace de travail. Les détails du data store de l'espace de travail sont spécifiés dans WorkspaceConfig . |
AdvancedSiteSearchConfig
Données de configuration pour la recherche avancée sur site.
Représentation JSON |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
Champs | |
---|---|
disableInitialIndex |
Si la valeur est définie sur "true", l'indexation initiale est désactivée pour DataStore. |
disableAutomaticRefresh |
Si la valeur est définie sur "true", l'actualisation automatique est désactivée pour DataStore. |
BillingEstimation
Estimation de la taille des données par data store.
Représentation JSON |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
Champs | |
---|---|
structuredDataSize |
Taille des données structurées en octets. |
unstructuredDataSize |
Taille des données non structurées en octets. |
websiteDataSize |
Taille des données pour les sites Web en octets. |
structuredDataUpdateTime |
Horodatage de la dernière mise à jour des données structurées. Utilise la norme RFC 3339, où la sortie générée utilise toujours le format UTC (indiqué par "Z" pour le temps universel coordonné) avec des secondes fractionnaires de 0, 3, 6 ou 9 chiffres décimaux. Des décalages horaires autres que "Z" (UTC) sont également acceptés. Exemples : |
unstructuredDataUpdateTime |
Horodatage de la dernière mise à jour des données non structurées. Utilise la norme RFC 3339, où la sortie générée utilise toujours le format UTC (indiqué par "Z" pour le temps universel coordonné) avec des secondes fractionnaires de 0, 3, 6 ou 9 chiffres décimaux. Des décalages horaires autres que "Z" (UTC) sont également acceptés. Exemples : |
websiteDataUpdateTime |
Horodatage de la dernière mise à jour pour les sites Web. Utilise la norme RFC 3339, où la sortie générée utilise toujours le format UTC (indiqué par "Z" pour le temps universel coordonné) avec des secondes fractionnaires de 0, 3, 6 ou 9 chiffres décimaux. Des décalages horaires autres que "Z" (UTC) sont également acceptés. Exemples : |
WorkspaceConfig
Configuration permettant de stocker la configuration du type de data store pour les données de l'espace de travail
Représentation JSON |
---|
{
"type": enum ( |
Champs | |
---|---|
type |
Source de données Google Workspace. |
dasherCustomerId |
Numéro client Dasher obscurci. |
superAdminServiceAccount |
Facultatif. Compte de service super-administrateur de l'espace de travail qui sera utilisé pour générer le jeton d'accès. Pour le moment, nous ne l'utilisons que pour l'ingestion de données du connecteur Google Drive natif. |
superAdminEmailAddress |
Facultatif. Adresse e-mail du super-administrateur de l'espace de travail qui sera utilisée pour générer le jeton d'accès. Pour le moment, nous ne l'utilisons que pour l'ingestion de données du connecteur Google Drive natif. |
Type
Spécifie le type d'application Workspace compatible avec ce DataStore
Enums | |
---|---|
TYPE_UNSPECIFIED |
La valeur par défaut est un type d'espace de travail non spécifié. |
GOOGLE_DRIVE |
Data store Workspace contient des données Drive |
GOOGLE_MAIL |
Le data store Workspace contient des données de messagerie |
GOOGLE_SITES |
Data store Workspace contient des données Sites |
GOOGLE_CALENDAR |
Data store Workspace contient des données Agenda |
GOOGLE_CHAT |
Le data store Workspace contient des données Chat |
GOOGLE_GROUPS |
Le data store Workspace contient des données de groupes |
GOOGLE_KEEP |
Data store Workspace contient des données Keep |
GOOGLE_PEOPLE |
Data store Workspace contient des données sur les personnes |
DocumentProcessingConfig
Ressource singleton de DataStore
. S'il est vide lorsque DataStore
est créé et que DataStore
est défini sur DataStore.ContentConfig.CONTENT_REQUIRED
, l'analyseur par défaut sera défini sur l'analyseur numérique.
Représentation JSON |
---|
{ "name": string, "chunkingConfig": { object ( |
Champs | |
---|---|
name |
Nom complet de la ressource de configuration du traitement des documents. Format : |
chunkingConfig |
Indique si le mode de segmentation est activé. |
defaultParsingConfig |
Configurations de l'analyseur de documents par défaut. Si ce champ n'est pas spécifié, nous le configurerons en tant que DigitalParsingConfig par défaut. La configuration d'analyse par défaut sera appliquée à tous les types de fichiers pour l'analyse de documents. |
parsingConfigOverrides |
Mappez le type de fichier pour remplacer la configuration d'analyse par défaut en fonction du type de fichier. Clés compatibles :
|
ChunkingConfig
Configuration pour la configuration de segmentation.
Représentation JSON |
---|
{ // Union field |
Champs | |
---|---|
Champ d'union chunk_mode . Configurations supplémentaires qui définissent le comportement du découpage. chunk_mode ne peut être qu'un des éléments suivants : |
|
layoutBasedChunkingConfig |
Configuration de la segmentation basée sur la mise en page. |
LayoutBasedChunkingConfig
Configuration de la segmentation basée sur la mise en page.
Représentation JSON |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
Champs | |
---|---|
chunkSize |
Taille limite des jetons pour chaque bloc. Valeurs acceptées : de 100 à 500 (inclus). La valeur par défaut est 500. |
includeAncestorHeadings |
Indique si des en-têtes de différents niveaux doivent être ajoutés aux fragments au milieu du document pour éviter toute perte de contexte. Valeur par défaut : "False". |
ParsingConfig
Configurations associées appliquées à un type spécifique d'analyseur de documents.
Représentation JSON |
---|
{ // Union field |
Champs | |
---|---|
Champ d'union type_dedicated_config . Configurations pour les types de traitement de documents. type_dedicated_config ne peut être qu'un des éléments suivants : |
|
digitalParsingConfig |
Configurations appliquées à l'analyseur numérique. |
ocrParsingConfig |
Configurations appliquées au parseur OCR. Pour le moment, cela ne s'applique qu'aux PDF. |
layoutParsingConfig |
Configurations appliquées à l'analyseur de mise en page. |
DigitalParsingConfig
Ce type ne comporte aucun champ.
Configurations d'analyse numérique des documents.
OcrParsingConfig
Configurations d'analyse OCR pour les documents.
Représentation JSON |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
Champs | |
---|---|
enhancedDocumentElements[] |
[OBSOLÈTE] Ce champ est obsolète. Pour utiliser le traitement amélioré des éléments de document supplémentaires, veuillez passer à |
useNativeText |
Si la valeur est "true", le texte natif sera utilisé au lieu du texte OCR sur les pages contenant du texte natif. |
LayoutParsingConfig
Configurations d'analyse de la mise en page pour les documents.
Représentation JSON |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
Champs | |
---|---|
enableTableAnnotation |
Facultatif. Si la valeur est "true", l'annotation basée sur un LLM est ajoutée au tableau lors de l'analyse. |
enableImageAnnotation |
Facultatif. Si la valeur est "true", l'annotation basée sur un LLM est ajoutée à l'image lors de l'analyse. |
structuredContentTypes[] |
Facultatif. Contient les types de structures requis à extraire du document. Valeurs autorisées :
|
excludeHtmlElements[] |
Facultatif. Liste des éléments HTML à exclure du contenu analysé. |
excludeHtmlClasses[] |
Facultatif. Liste des classes HTML à exclure du contenu analysé. |
excludeHtmlIds[] |
Facultatif. Liste des ID HTML à exclure du contenu analysé. |
enableGetProcessedDocument |
Facultatif. Si la valeur est "true", le document traité sera disponible pour l'API GetProcessedDocument. |
HealthcareFhirConfig
Configurer le data store pour le secteur HEALTHCARE_FHIR
.
Représentation JSON |
---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
Champs | |
---|---|
enableConfigurableSchema |
Indique si le schéma configurable doit être activé pour le secteur Si la valeur est définie sur |
enableStaticIndexingForBatchIngestion |
Indique s'il faut activer l'indexation statique pour l'ingestion par lot Si la valeur est définie sur |
ServingConfigDataStore
Stocke les informations concernant les configurations de diffusion au niveau DataStore.
Représentation JSON |
---|
{ "disabledForServing": boolean } |
Champs | |
---|---|
disabledForServing |
Facultatif. Si la valeur est "true", DataStore ne sera pas disponible pour répondre aux requêtes de recherche. |
ConfigurableBillingApproach
Configuration de l'approche de facturation configurable.
Enums | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Valeur par défaut. Pour l'approche de facturation non configurable Spark et non Spark. |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Utilisez la facturation par abonnement de base + dépassement pour l'indexation du cœur pour le stockage sans intégration. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Utilisez la facturation à la consommation avec paiement à l'usage pour le module complémentaire de stockage pour l'intégration. |
Méthodes |
|
---|---|
|
Complète la saisie utilisateur spécifiée par des suggestions de mots clés. |
|
Crée un objet DataStore . |
|
Supprime un DataStore . |
|
Récupère un DataStore . |
|
Récupère les SiteSearchEngine . |
|
Liste tous les DataStore associés au projet. |
|
Met à jour un DataStore |
|
Entraîne un modèle personnalisé. |