- Ressource: DataStore
- JSON-Darstellung
- ContentConfig
- AdvancedSiteSearchConfig
- BillingEstimation
- WorkspaceConfig
- Typ
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Methoden
Ressource: DataStore
DataStore erfasst globale Einstellungen und Konfigurationen auf DataStore-Ebene.
JSON-Darstellung |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
Felder | |
---|---|
name |
Nicht veränderbar. ID. Der vollständige Ressourcenname des Datenspeichers. Format: Dieses Feld muss ein UTF-8-codierter String mit einer Längenbeschränkung von 1.024 Zeichen sein. |
displayName |
Erforderlich. Der Anzeigename des Datenspeichers. Dieses Feld muss ein UTF-8-codierter String mit einer Längenbeschränkung von 128 Zeichen sein. Andernfalls wird der Fehler INVALID_ARGUMENT zurückgegeben. |
industryVertical |
Nicht veränderbar. Die Branche, in der der Datenspeicher registriert ist. |
solutionTypes[] |
Die Lösungen, für die der Datenspeicher registriert ist. Verfügbare Lösungen für die einzelnen
|
defaultSchemaId |
Nur Ausgabe. Die ID der Standard- |
contentConfig |
Nicht veränderbar. Die Inhaltskonfiguration des Datenspeichers. Wenn dieses Feld nicht festgelegt ist, wird standardmäßig |
createTime |
Nur Ausgabe. Zeitstempel für die Erstellung von Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
advancedSiteSearchConfig |
Optional. Konfiguration für die erweiterte Websitesuche. |
kmsKeyName |
Nur Eingabe. Der KMS-Schlüssel, der zum Schutz dieses Datenspeichers bei der Erstellung verwendet werden soll. Muss für Anfragen festgelegt werden, die den CMEK-Organisationsrichtlinien entsprechen müssen. Wenn dieses Feld festgelegt und erfolgreich verarbeitet wird, wird der DataStore durch den KMS-Schlüssel geschützt, wie im Feld „cmekConfig“ angegeben. |
cmekConfig |
Nur Ausgabe. CMEK-bezogene Informationen für den DataStore. |
billingEstimation |
Nur Ausgabe. Schätzung der Datengröße für die Abrechnung. |
aclEnabled |
Nicht veränderbar. Ob Daten in Wenn die ACL für Derzeit wird ACL nur in der Branche |
workspaceConfig |
Konfiguration zum Speichern der Datenspeichertypkonfiguration für Arbeitsbereichsdaten. Dieser muss festgelegt werden, wenn |
documentProcessingConfig |
Konfiguration für Dokumentverständnis und ‑anreicherung. |
startingSchema |
Das Startschema, das für diese Dieses Feld wird nur von der Das bereitgestellte Schema wird anhand bestimmter Schemaregeln validiert. Weitere Informationen |
healthcareFhirConfig |
Optional. Konfiguration für die Branche |
servingConfigDataStore |
Optional. Konfiguration auf DataStore-Ebene speichern. |
identityMappingStore |
Nicht veränderbar. Der vollständig qualifizierte Ressourcenname der zugehörigen |
isInfobotFaqDataStore |
Optional. Wenn festgelegt, ist dieser DataStore ein Infobot-FAQ-DataStore. |
configurableBillingApproach |
Optional. Konfiguration für den konfigurierbaren Abrechnungsansatz. Siehe |
ContentConfig
Inhaltskonfiguration des Datenspeichers.
Enums | |
---|---|
CONTENT_CONFIG_UNSPECIFIED |
Standardwert. |
NO_CONTENT |
Enthält nur Dokumente ohne Document.content . |
CONTENT_REQUIRED |
Enthält nur Dokumente mit Document.content . |
PUBLIC_WEBSITE |
Der Datenspeicher wird für die Suche auf öffentlichen Websites verwendet. |
GOOGLE_WORKSPACE |
Der Datenspeicher wird für die Suche im Arbeitsbereich verwendet. Details zum Arbeitsbereich-Datenspeicher werden in der WorkspaceConfig angegeben. |
AdvancedSiteSearchConfig
Konfigurationsdaten für die erweiterte Websitesuche.
JSON-Darstellung |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
Felder | |
---|---|
disableInitialIndex |
Bei Einstellung auf „true“ wird die Erstindexierung für den DataStore deaktiviert. |
disableAutomaticRefresh |
Bei Einstellung auf „true“ wird die automatische Aktualisierung für den DataStore deaktiviert. |
BillingEstimation
Schätzung der Datengröße pro Datenspeicher.
JSON-Darstellung |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
Felder | |
---|---|
structuredDataSize |
Datengröße für strukturierte Daten in Byte. |
unstructuredDataSize |
Datengröße für unstrukturierte Daten in Byte. |
websiteDataSize |
Datengröße für Websites in Byte. |
structuredDataUpdateTime |
Zeitstempel der letzten Aktualisierung der strukturierten Daten. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
unstructuredDataUpdateTime |
Zeitstempel der letzten Aktualisierung für unstrukturierte Daten. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
websiteDataUpdateTime |
Zeitstempel der letzten Aktualisierung für Websites. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
WorkspaceConfig
Konfiguration zum Speichern der Datenspeichertypkonfiguration für Workspace-Daten
JSON-Darstellung |
---|
{
"type": enum ( |
Felder | |
---|---|
type |
Die Google Workspace-Datenquelle. |
dasherCustomerId |
Verschleierte Dasher-Kundennummer. |
superAdminServiceAccount |
Optional. Das Super Admin-Dienstkonto für den Arbeitsbereich, das zum Generieren von Zugriffstokens verwendet wird. Derzeit wird er nur für die Datenaufnahme mit dem nativen Google Drive-Connector verwendet. |
superAdminEmailAddress |
Optional. Die E‑Mail-Adresse des Super Admins für den Arbeitsbereich, der für die Generierung des Zugriffstokens verwendet wird. Derzeit wird er nur für die Datenaufnahme mit dem nativen Google Drive-Connector verwendet. |
Typ
Gibt den Typ der Workspace-App an, die von diesem Datenspeicher unterstützt wird.
Enums | |
---|---|
TYPE_UNSPECIFIED |
Standardmäßig wird ein nicht angegebener Workspace-Typ verwendet. |
GOOGLE_DRIVE |
Workspace-Datenspeicher enthält Drive-Daten |
GOOGLE_MAIL |
Der Workspace-Datenspeicher enthält Mail-Daten. |
GOOGLE_SITES |
Workspace-Datenspeicher enthält Sites-Daten |
GOOGLE_CALENDAR |
Der Workspace-Datenspeicher enthält Kalenderdaten |
GOOGLE_CHAT |
Workspace-Datenspeicher enthält Chat-Daten |
GOOGLE_GROUPS |
Der Workspace-Datenspeicher enthält Gruppendaten |
GOOGLE_KEEP |
Der Workspace-Datenspeicher enthält Keep-Daten |
GOOGLE_PEOPLE |
Workspace-Datenspeicher enthält Personendaten |
DocumentProcessingConfig
Eine Singleton-Ressource von DataStore
. Wenn das Feld leer ist, wenn DataStore
erstellt wird und DataStore
auf DataStore.ContentConfig.CONTENT_REQUIRED
gesetzt ist, wird standardmäßig der digitale Parser verwendet.
JSON-Darstellung |
---|
{ "name": string, "chunkingConfig": { object ( |
Felder | |
---|---|
name |
Der vollständige Ressourcenname der Konfiguration für die Dokumentverarbeitung. Format: |
chunkingConfig |
Gibt an, ob der Chunking-Modus aktiviert ist. |
defaultParsingConfig |
Konfigurationen für den Standardparser für Dokumente. Wenn dies nicht angegeben ist, wird die Standard-DigitalParsingConfig konfiguriert und die Standardkonfiguration für das Parsen wird auf alle Dateitypen für das Parsen von Dokumenten angewendet. |
parsingConfigOverrides |
Zuordnung vom Dateityp zum Überschreiben der Standardkonfiguration für das Parsen basierend auf dem Dateityp. Unterstützte Schlüssel:
|
ChunkingConfig
Konfiguration für die Chunking-Konfiguration.
JSON-Darstellung |
---|
{ // Union field |
Felder | |
---|---|
Union-Feld chunk_mode . Zusätzliche Konfigurationen, die das Verhalten der Chunking-Funktion definieren. Für chunk_mode ist nur einer der folgenden Werte zulässig: |
|
layoutBasedChunkingConfig |
Konfiguration für die auf dem Layout basierende Aufteilung. |
LayoutBasedChunkingConfig
Konfiguration für die auf dem Layout basierende Aufteilung.
JSON-Darstellung |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
Felder | |
---|---|
chunkSize |
Das Token-Größenlimit für jeden Chunk. Unterstützte Werte: 100–500 (einschließlich). Standardwert: 500 |
includeAncestorHeadings |
Gibt an, ob verschiedene Überschriftenebenen an Blöcke aus der Mitte des Dokuments angehängt werden sollen, um Kontextverlust zu vermeiden. Standardwert: „False“. |
ParsingConfig
Zugehörige Konfigurationen, die auf einen bestimmten Dokumentparser angewendet werden.
JSON-Darstellung |
---|
{ // Union field |
Felder | |
---|---|
Union-Feld type_dedicated_config . Konfigurationen für Dokumentverarbeitungstypen. Für type_dedicated_config ist nur einer der folgenden Werte zulässig: |
|
digitalParsingConfig |
Konfigurationen, die auf den digitalen Parser angewendet wurden. |
ocrParsingConfig |
Auf den OCR-Parser angewendete Konfigurationen. Derzeit gilt das nur für PDFs. |
layoutParsingConfig |
Auf den Layoutparser angewendete Konfigurationen. |
DigitalParsingConfig
Dieser Typ hat keine Felder.
Die Konfigurationen für das digitale Parsen von Dokumenten.
OcrParsingConfig
Die OCR-Parsing-Konfigurationen für Dokumente.
JSON-Darstellung |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
Felder | |
---|---|
enhancedDocumentElements[] |
[VERWORFEN] Die Verwendung dieses Feldes wurde eingestellt. Wenn Sie die zusätzliche Verarbeitung erweiterter Dokumentelemente nutzen möchten, wechseln Sie zu |
useNativeText |
Wenn „true“ festgelegt ist, wird auf Seiten mit nativem Text nativer Text anstelle von OCR-Text verwendet. |
LayoutParsingConfig
Die Konfigurationen für das Parsen des Layouts von Dokumenten.
JSON-Darstellung |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
Felder | |
---|---|
enableTableAnnotation |
Optional. Wenn „true“, wird der Tabelle während des Parsens eine LLM-basierte Annotation hinzugefügt. |
enableImageAnnotation |
Optional. Wenn „true“, wird dem Bild während des Parsens die LLM-basierte Annotation hinzugefügt. |
structuredContentTypes[] |
Optional. Enthält die erforderlichen Strukturtypen, die aus dem Dokument extrahiert werden sollen. Unterstützte Werte:
|
excludeHtmlElements[] |
Optional. Liste der HTML-Elemente, die aus den geparsten Inhalten ausgeschlossen werden sollen. |
excludeHtmlClasses[] |
Optional. Liste der HTML-Klassen, die aus dem geparsten Inhalt ausgeschlossen werden sollen. |
excludeHtmlIds[] |
Optional. Liste der HTML-IDs, die aus den geparsten Inhalten ausgeschlossen werden sollen. |
enableGetProcessedDocument |
Optional. Bei „true“ wird das verarbeitete Dokument für die GetProcessedDocument API verfügbar gemacht. |
HealthcareFhirConfig
Konfiguration für den Datenspeicher für die Branche HEALTHCARE_FHIR
.
JSON-Darstellung |
---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
Felder | |
---|---|
enableConfigurableSchema |
Gibt an, ob das konfigurierbare Schema für die Wenn diese Option auf |
enableStaticIndexingForBatchIngestion |
Gibt an, ob die statische Indexierung für die Wenn der Wert auf |
ServingConfigDataStore
Speichert Informationen zu den Bereitstellungskonfigurationen auf DataStore-Ebene.
JSON-Darstellung |
---|
{ "disabledForServing": boolean } |
Felder | |
---|---|
disabledForServing |
Optional. Wenn auf „true“ gesetzt, ist der DataStore nicht für die Bearbeitung von Suchanfragen verfügbar. |
ConfigurableBillingApproach
Konfiguration für den konfigurierbaren Abrechnungsansatz.
Enums | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Standardwert. Nicht konfigurierbarer Abrechnungsansatz für Spark und Nicht-Spark. |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Verwenden Sie die Abrechnung für Abo-Basis und Überschreitung für den Indexierungskern für Speicher ohne Einbettung. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Verwenden Sie die nutzungsbasierte Pay-as-you-go-Abrechnung für das Add-on für eingebetteten Speicher. |
Methoden |
|
---|---|
|
Vervollständigt die angegebene Nutzereingabe mit Keyword-Vorschlägen |
|
Erstellt einen DataStore . |
|
Löscht ein DataStore . |
|
Erstellt einen DataStore . |
|
Ruft die SiteSearchEngine ab. |
|
Listet alle DataStore auf, die dem Projekt zugeordnet sind. |
|
Aktualisiert eine DataStore |
|
Trainiert ein benutzerdefiniertes Modell. |