- Ressource: DataStore
- JSON-Darstellung
- ContentConfig
- AdvancedSiteSearchConfig
- BillingEstimation
- WorkspaceConfig
- Typ
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Methoden
Ressource: DataStore
DataStore erfasst globale Einstellungen und Konfigurationen auf DataStore-Ebene.
| JSON-Darstellung |
|---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
| Felder | |
|---|---|
name |
Nicht veränderbar. ID. Der vollständige Ressourcenname des Datenspeichers. Format: Dieses Feld muss ein UTF-8-codierter String mit einer Längenbeschränkung von 1.024 Zeichen sein. |
displayName |
Erforderlich. Der Anzeigename des Datenspeichers Dieses Feld muss ein UTF-8-codierter String mit einer Längenbeschränkung von 128 Zeichen sein. Andernfalls wird der Fehler INVALID_ARGUMENT zurückgegeben. |
industryVertical |
Nicht veränderbar. Die Branche, in der der Datenspeicher registriert ist |
solutionTypes[] |
Die Lösungen, für die der Datenspeicher registriert ist. Verfügbare Lösungen für jede
|
defaultSchemaId |
Nur Ausgabe. Die ID des Standard- |
contentConfig |
Nicht veränderbar. Die Inhaltskonfiguration des Datenspeichers. Wenn dieses Feld nicht festgelegt ist, wird standardmäßig |
createTime |
Nur Ausgabe. Zeitstempel für die Erstellung von Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
advancedSiteSearchConfig |
Optional. Konfiguration für die erweiterte Websitesuche. |
kmsKeyName |
Nur Eingabe. Der KMS-Schlüssel, der zum Schutz dieses Datenspeichers bei der Erstellung verwendet werden soll Muss für Anfragen festgelegt werden, die den Schutzmaßnahmen der CMEK-Organisationsrichtlinien nachkommen müssen. Wenn dieses Feld festgelegt und erfolgreich verarbeitet wird, wird der DataStore durch den KMS-Schlüssel geschützt, wie im Feld „cmekConfig“ angegeben. |
cmekConfig |
Nur Ausgabe. CMEK-bezogene Informationen für den DataStore |
billingEstimation |
Nur Ausgabe. Schätzung der Datengröße für die Abrechnung |
aclEnabled |
Nicht veränderbar. Gibt an, ob Daten in Wenn die ACL für Derzeit wird ACL nur in der Branche |
workspaceConfig |
Konfiguration zum Speichern der Datenspeichertyp-Konfiguration für Arbeitsbereichsdaten. Diese muss festgelegt werden, wenn |
documentProcessingConfig |
Konfiguration für das Verständnis und die Anreicherung von Dokumenten |
startingSchema |
Das Startschema, das für diesen Dieses Feld wird nur von der Das bereitgestellte Schema wird anhand bestimmter Schemaregeln validiert. Weitere Informationen finden Sie in diesem Dokument. |
healthcareFhirConfig |
Optional. Konfiguration für die Branche |
servingConfigDataStore |
Optional. Speichert die Bereitstellungskonfiguration auf DataStore-Ebene |
identityMappingStore |
Nicht veränderbar. Der vollständig qualifizierte Ressourcenname des zugehörigen |
isInfobotFaqDataStore |
Optional. Wenn festgelegt, ist dieser DataStore ein Infobot-FAQ-DataStore. |
configurableBillingApproach |
Optional. Konfiguration für den konfigurierbaren Abrechnungsansatz Siehe |
configurableBillingApproachUpdateTime |
Nur Ausgabe. Der Zeitstempel, der angibt, wann „configurableBillingApproach“ zuletzt aktualisiert wurde. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
ContentConfig
Inhaltskonfiguration des Datenspeichers
| Enums | |
|---|---|
CONTENT_CONFIG_UNSPECIFIED |
Standardwert |
NO_CONTENT |
Enthält nur Dokumente ohne Document.content |
CONTENT_REQUIRED |
Enthält nur Dokumente mit Document.content |
PUBLIC_WEBSITE |
Der Datenspeicher wird für die Suche auf öffentlichen Websites verwendet. |
GOOGLE_WORKSPACE |
Der Datenspeicher wird für die Suche im Arbeitsbereich verwendet. Details zum Arbeitsbereich-Datenspeicher werden in der WorkspaceConfig angegeben. |
AdvancedSiteSearchConfig
Konfigurationsdaten für die erweiterte Websitesuche.
| JSON-Darstellung |
|---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
| Felder | |
|---|---|
disableInitialIndex |
Bei Festlegung auf „true“ wird die Erstindexierung für den DataStore deaktiviert. |
disableAutomaticRefresh |
Bei Festlegung auf „true“ wird die automatische Aktualisierung für den DataStore deaktiviert. |
BillingEstimation
Schätzung der Datengröße pro Datenspeicher
| JSON-Darstellung |
|---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
| Felder | |
|---|---|
structuredDataSize |
Datengröße für strukturierte Daten in Byte |
unstructuredDataSize |
Datengröße für unstrukturierte Daten in Byte |
websiteDataSize |
Datengröße für Websites in Byte |
structuredDataUpdateTime |
Zeitstempel der letzten Aktualisierung der strukturierten Daten Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
unstructuredDataUpdateTime |
Zeitstempel der letzten Aktualisierung für unstrukturierte Daten Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
websiteDataUpdateTime |
Zeitstempel der letzten Aktualisierung für Websites Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
WorkspaceConfig
Konfiguration zum Speichern der Datenspeichertypkonfiguration für Arbeitsbereichsdaten
| JSON-Darstellung |
|---|
{
"type": enum ( |
| Felder | |
|---|---|
type |
Die Google Workspace-Datenquelle |
dasherCustomerId |
Verschleierte Dasher-Kundennummer |
superAdminServiceAccount |
Optional. Das Super Admin-Dienstkonto für den Arbeitsbereich, der zum Generieren von Zugriffstokens verwendet wird. Derzeit wird es nur für die Datenaufnahme mit dem nativen Google Drive-Connector verwendet. |
superAdminEmailAddress |
Optional. Die E‑Mail-Adresse des Super Admins für den Arbeitsbereich, der für die Generierung des Zugriffstokens verwendet wird. Derzeit wird es nur für die Datenaufnahme mit dem nativen Google Drive-Connector verwendet. |
Typ
Gibt den Typ der Workspace-App an, die von diesem Datenspeicher unterstützt wird
| Enums | |
|---|---|
TYPE_UNSPECIFIED |
Standardmäßig wird ein nicht angegebener Workspace-Typ verwendet. |
GOOGLE_DRIVE |
Workspace-Datenspeicher enthält Drive-Daten |
GOOGLE_MAIL |
Workspace-Datenspeicher enthält Mail-Daten |
GOOGLE_SITES |
Workspace-Datenspeicher enthält Sites-Daten |
GOOGLE_CALENDAR |
Workspace-Datenspeicher enthält Kalenderdaten |
GOOGLE_CHAT |
Workspace-Datenspeicher enthält Chat-Daten |
GOOGLE_GROUPS |
Workspace-Datenspeicher enthält Gruppendaten |
GOOGLE_KEEP |
Workspace-Datenspeicher enthält Keep-Daten |
GOOGLE_PEOPLE |
Workspace-Datenspeicher enthält Personendaten |
DocumentProcessingConfig
Eine Singleton-Ressource von DataStore. Wenn das Feld leer ist, wenn DataStore erstellt wird und DataStore auf DataStore.ContentConfig.CONTENT_REQUIRED gesetzt ist, wird standardmäßig der digitale Parser verwendet.
| JSON-Darstellung |
|---|
{ "name": string, "chunkingConfig": { object ( |
| Felder | |
|---|---|
name |
Der vollständige Ressourcenname der Konfiguration für die Dokumentverarbeitung. Format: |
chunkingConfig |
Gibt an, ob der Blockaufteilungsmodus aktiviert ist |
defaultParsingConfig |
Konfigurationen für den Standardparser für Dokumente. Wenn dies nicht angegeben ist, wird die Standard-DigitalParsingConfig konfiguriert und die Standardkonfiguration für das Parsing wird auf alle Dateitypen für das Parsing von Dokumenten angewendet. |
parsingConfigOverrides |
Zuordnung vom Dateityp zum Überschreiben der Standardkonfiguration für das Parsing basierend auf dem Dateityp. Unterstützte Schlüssel:
|
ChunkingConfig
Konfiguration für die Blockaufteilungskonfiguration
| JSON-Darstellung |
|---|
{ // Union field |
| Felder | |
|---|---|
Union-Feld chunk_mode. Zusätzliche Konfigurationen, die das Verhalten der Blockaufteilung definieren. Für chunk_mode ist nur einer der folgenden Werte zulässig: |
|
layoutBasedChunkingConfig |
Konfiguration für die layoutbasierte Blockaufteilung |
LayoutBasedChunkingConfig
Konfiguration für die layoutbasierte Blockaufteilung
| JSON-Darstellung |
|---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
| Felder | |
|---|---|
chunkSize |
Das Tokengrößenlimit für jeden Block Unterstützte Werte: 100–500 (einschließlich). Standardwert: 500 |
includeAncestorHeadings |
Gibt an, ob verschiedene Überschriftenebenen an Blöcke aus der Mitte des Dokuments angehängt werden sollen, um Kontextverlust zu verhindern Standardwert: False |
ParsingConfig
Zugehörige Konfigurationen, die auf einen bestimmten Dokumentparser angewendet werden
| JSON-Darstellung |
|---|
{ // Union field |
| Felder | |
|---|---|
Union-Feld type_dedicated_config. Konfigurationen für Dokumentverarbeitungstypen. Für type_dedicated_config ist nur einer der folgenden Werte zulässig: |
|
digitalParsingConfig |
Konfigurationen, die auf den digitalen Parser angewendet wurden |
ocrParsingConfig |
Auf den OCR-Parser angewendete Konfigurationen. Derzeit gilt das nur für PDFs. |
layoutParsingConfig |
Auf den Layoutparser angewendete Konfigurationen |
DigitalParsingConfig
Dieser Typ hat keine Felder.
Die Konfigurationen für das digitale Parsing von Dokumenten
OcrParsingConfig
Die OCR-Parsingkonfigurationen für Dokumente
| JSON-Darstellung |
|---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
| Felder | |
|---|---|
enhancedDocumentElements[] |
[VERWORFEN] Dieses Feld wird nicht mehr unterstützt. Wenn Sie die zusätzliche Verarbeitung erweiterter Dokumentelemente nutzen möchten, wechseln Sie zu |
useNativeText |
Wenn „true“ festgelegt ist, wird auf Seiten mit nativem Text nativer Text anstelle von OCR-Text verwendet. |
LayoutParsingConfig
Die Konfigurationen für das Parsing des Layouts von Dokumenten.
| JSON-Darstellung |
|---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "enableLlmLayoutParsing": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
| Felder | |
|---|---|
enableTableAnnotation |
Optional. Bei „true“ wird der Tabelle während des Parsings die LLM-basierte Annotation hinzugefügt. |
enableImageAnnotation |
Optional. Bei „true“ wird dem Bild während des Parsings die LLM-basierte Annotation hinzugefügt. |
enableLlmLayoutParsing |
Optional. Wenn „true“, wird das PDF-Layout mit einem LLM optimiert. |
structuredContentTypes[] |
Optional. Enthält die erforderlichen Strukturtypen, die aus dem Dokument extrahiert werden sollen. Unterstützte Werte:
|
excludeHtmlElements[] |
Optional. Liste der HTML-Elemente, die aus den geparsten Inhalten ausgeschlossen werden sollen |
excludeHtmlClasses[] |
Optional. Liste der HTML-Klassen, die aus den geparsten Inhalten ausgeschlossen werden sollen |
excludeHtmlIds[] |
Optional. Liste der HTML-IDs, die aus den geparsten Inhalten ausgeschlossen werden sollen |
enableGetProcessedDocument |
Optional. Bei „true“ wird das verarbeitete Dokument für die GetProcessedDocument API verfügbar gemacht. |
HealthcareFhirConfig
Konfiguration für den Datenspeicher für die Branche HEALTHCARE_FHIR
| JSON-Darstellung |
|---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
| Felder | |
|---|---|
enableConfigurableSchema |
Gibt an, ob das konfigurierbare Schema für die Branche Wenn diese Option auf |
enableStaticIndexingForBatchIngestion |
Gibt an, ob die statische Indexierung für die Wenn der Wert auf |
ServingConfigDataStore
Speichert Informationen zu den Bereitstellungskonfigurationen auf DataStore-Ebene
| JSON-Darstellung |
|---|
{ "disabledForServing": boolean } |
| Felder | |
|---|---|
disabledForServing |
Optional. Wenn auf „true“ gesetzt, ist der DataStore nicht für die Bearbeitung von Suchanfragen verfügbar. |
ConfigurableBillingApproach
Konfiguration für den konfigurierbaren Abrechnungsansatz
| Enums | |
|---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Standardwert. Nicht konfigurierbarer Abrechnungsansatz für Spark und Nicht-Spark |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Verwenden Sie die Abrechnung für Abobasis und Überschreitung für den Indexierungskern für Speicher ohne Einbettung. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Verwenden Sie die nutzungsbasierte Pay-as-you-go-Abrechnung für das Add-on für eingebetteten Speicher. |
Methoden |
|
|---|---|
|
Vervollständigt die angegebene Nutzereingabe mit Keyword-Vorschlägen |
|
Erstellt einen DataStore |
|
Löscht ein DataStore |
|
Ruft einen DataStore ab |
|
Ruft die SiteSearchEngine ab |
|
Listet alle DataStores auf, die dem Projekt zugeordnet sind |
|
Aktualisiert einen DataStore |
|
Trainiert ein benutzerdefiniertes Modell |