- Ressource: DataStore
- JSON-Darstellung
- AdvancedSiteSearchConfig
- LanguageInfo
- NaturalLanguageQueryUnderstandingConfig
- Modus
- BillingEstimation
- WorkspaceConfig
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Methoden
Ressource: DataStore
DataStore erfasst globale Einstellungen und Konfigurationen auf DataStore-Ebene.
JSON-Darstellung |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
Felder | |
---|---|
name |
Nicht veränderbar. ID. Der vollständige Ressourcenname des Datenspeichers. Format: Dieses Feld muss ein UTF-8-codierter String mit einer Längenbeschränkung von 1.024 Zeichen sein. |
displayName |
Erforderlich. Der Anzeigename des Datenspeichers. Dieses Feld muss ein UTF-8-codierter String mit einer Längenbeschränkung von 128 Zeichen sein. Andernfalls wird der Fehler INVALID_ARGUMENT zurückgegeben. |
industryVertical |
Nicht veränderbar. Die Branche, in der der Datenspeicher registriert ist. |
solutionTypes[] |
Die Lösungen, für die der Datenspeicher registriert ist. Verfügbare Lösungen für die einzelnen
|
defaultSchemaId |
Nur Ausgabe. Die ID der Standard- |
contentConfig |
Nicht veränderbar. Die Inhaltskonfiguration des Datenspeichers. Wenn dieses Feld nicht festgelegt ist, wird standardmäßig |
createTime |
Nur Ausgabe. Zeitstempel für die Erstellung von Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
advancedSiteSearchConfig |
Optional. Konfiguration für die erweiterte Websitesuche. |
languageInfo |
Sprachinformationen für DataStore. |
naturalLanguageQueryUnderstandingConfig |
Optional. Konfiguration für die Interpretation von Anfragen in natürlicher Sprache. |
kmsKeyName |
Nur Eingabe. Der KMS-Schlüssel, der zum Schutz dieses Datenspeichers bei der Erstellung verwendet werden soll. Muss für Anfragen festgelegt werden, die den CMEK-Organisationsrichtlinien entsprechen müssen. Wenn dieses Feld festgelegt und erfolgreich verarbeitet wird, wird der DataStore durch den KMS-Schlüssel geschützt, wie im Feld „cmekConfig“ angegeben. |
cmekConfig |
Nur Ausgabe. CMEK-bezogene Informationen für den DataStore. |
idpConfig |
Nur Ausgabe. Konfiguration des Identitätsanbieters auf Datenspeicherebene. |
billingEstimation |
Nur Ausgabe. Schätzung der Datengröße für die Abrechnung. |
aclEnabled |
Nicht veränderbar. Ob Daten in Wenn die ACL für Derzeit wird ACL nur in der Branche |
workspaceConfig |
Konfiguration zum Speichern der Datenspeichertypkonfiguration für Arbeitsbereichsdaten. Dieser muss festgelegt werden, wenn |
documentProcessingConfig |
Konfiguration für Dokumentverständnis und ‑anreicherung. |
startingSchema |
Das Startschema, das für diese Dieses Feld wird nur von der Das bereitgestellte Schema wird anhand bestimmter Schemaregeln validiert. Weitere Informationen |
healthcareFhirConfig |
Optional. Konfiguration für die Branche |
servingConfigDataStore |
Optional. Konfiguration auf DataStore-Ebene speichern. |
identityMappingStore |
Nicht veränderbar. Der vollständig qualifizierte Ressourcenname der zugehörigen |
isInfobotFaqDataStore |
Optional. Wenn festgelegt, ist dieser DataStore ein Infobot-FAQ-DataStore. |
configurableBillingApproach |
Optional. Konfiguration für den konfigurierbaren Abrechnungsansatz. Siehe |
AdvancedSiteSearchConfig
Konfigurationsdaten für die erweiterte Websitesuche.
JSON-Darstellung |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
Felder | |
---|---|
disableInitialIndex |
Bei Einstellung auf „true“ wird die Erstindexierung für den DataStore deaktiviert. |
disableAutomaticRefresh |
Bei Einstellung auf „true“ wird die automatische Aktualisierung für den DataStore deaktiviert. |
LanguageInfo
Sprachinformationen für DataStore.
JSON-Darstellung |
---|
{ "languageCode": string, "normalizedLanguageCode": string, "language": string, "region": string } |
Felder | |
---|---|
languageCode |
Der Sprachcode für den DataStore. |
normalizedLanguageCode |
Nur Ausgabe. Dies ist die normalisierte Form von „languageCode“. Beispiel: Der languageCode von |
language |
Nur Ausgabe. Sprachanteil von „normalizedLanguageCode“. z. B.: |
region |
Nur Ausgabe. Der Regionsteil von „normalizedLanguageCode“, falls vorhanden. z. B.: |
NaturalLanguageQueryUnderstandingConfig
Konfiguration für die Interpretation von Anfragen in natürlicher Sprache.
JSON-Darstellung |
---|
{
"mode": enum ( |
Felder | |
---|---|
mode |
Modus für die Interpretation von Anfragen in natürlicher Sprache. Wenn dieses Feld nicht festgelegt ist, wird standardmäßig |
Modus
Modus für die Interpretation von Anfragen in natürlicher Sprache. Wenn NaturalLanguageQueryUnderstandingConfig.Mode auf ENABLED gesetzt ist, werden die Funktionen für das Verarbeiten von Anfragen in natürlicher Sprache für eine Suchanfrage aktiviert, wenn NaturalLanguageQueryUnderstandingSpec.FilterExtractionCondition in der SearchRequest auf ENABLED gesetzt ist.
Enums | |
---|---|
MODE_UNSPECIFIED |
Standardwert. |
DISABLED |
Die Interpretation von Anfragen in natürlicher Sprache ist deaktiviert. |
ENABLED |
Die Interpretation von Anfragen in natürlicher Sprache ist aktiviert. |
BillingEstimation
Schätzung der Datengröße pro Datenspeicher.
JSON-Darstellung |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
Felder | |
---|---|
structuredDataSize |
Datengröße für strukturierte Daten in Byte. |
unstructuredDataSize |
Datengröße für unstrukturierte Daten in Byte. |
websiteDataSize |
Datengröße für Websites in Byte. |
structuredDataUpdateTime |
Zeitstempel der letzten Aktualisierung der strukturierten Daten. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
unstructuredDataUpdateTime |
Zeitstempel der letzten Aktualisierung für unstrukturierte Daten. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
websiteDataUpdateTime |
Zeitstempel der letzten Aktualisierung für Websites. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
WorkspaceConfig
Konfiguration zum Speichern der Datenspeichertypkonfiguration für Workspace-Daten
JSON-Darstellung |
---|
{
"type": enum ( |
Felder | |
---|---|
type |
Die Google Workspace-Datenquelle. |
dasherCustomerId |
Verschleierte Dasher-Kundennummer. |
superAdminServiceAccount |
Optional. Das Super Admin-Dienstkonto für den Arbeitsbereich, das zum Generieren von Zugriffstokens verwendet wird. Derzeit wird er nur für die Datenaufnahme mit dem nativen Google Drive-Connector verwendet. |
superAdminEmailAddress |
Optional. Die E‑Mail-Adresse des Super Admins für den Arbeitsbereich, der für die Generierung des Zugriffstokens verwendet wird. Derzeit wird er nur für die Datenaufnahme mit dem nativen Google Drive-Connector verwendet. |
DocumentProcessingConfig
Eine Singleton-Ressource von DataStore
. Wenn das Feld leer ist, wenn DataStore
erstellt wird und DataStore
auf DataStore.ContentConfig.CONTENT_REQUIRED
gesetzt ist, wird standardmäßig der digitale Parser verwendet.
JSON-Darstellung |
---|
{ "name": string, "chunkingConfig": { object ( |
Felder | |
---|---|
name |
Der vollständige Ressourcenname der Konfiguration für die Dokumentverarbeitung. Format: |
chunkingConfig |
Gibt an, ob der Chunking-Modus aktiviert ist. |
defaultParsingConfig |
Konfigurationen für den Standardparser für Dokumente. Wenn dies nicht angegeben ist, wird die Standard-DigitalParsingConfig konfiguriert und die Standardkonfiguration für das Parsen wird auf alle Dateitypen für das Parsen von Dokumenten angewendet. |
parsingConfigOverrides |
Zuordnung vom Dateityp zum Überschreiben der Standardkonfiguration für das Parsen basierend auf dem Dateityp. Unterstützte Schlüssel:
|
ChunkingConfig
Konfiguration für die Chunking-Konfiguration.
JSON-Darstellung |
---|
{ // Union field |
Felder | |
---|---|
Union-Feld chunk_mode . Zusätzliche Konfigurationen, die das Verhalten der Chunking-Funktion definieren. Für chunk_mode ist nur einer der folgenden Werte zulässig: |
|
layoutBasedChunkingConfig |
Konfiguration für die auf dem Layout basierende Aufteilung. |
LayoutBasedChunkingConfig
Konfiguration für die auf dem Layout basierende Aufteilung.
JSON-Darstellung |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
Felder | |
---|---|
chunkSize |
Das Token-Größenlimit für jeden Chunk. Unterstützte Werte: 100–500 (einschließlich). Standardwert: 500 |
includeAncestorHeadings |
Gibt an, ob verschiedene Überschriftenebenen an Blöcke aus der Mitte des Dokuments angehängt werden sollen, um Kontextverlust zu vermeiden. Standardwert: „False“. |
ParsingConfig
Zugehörige Konfigurationen, die auf einen bestimmten Dokumentparser angewendet werden.
JSON-Darstellung |
---|
{ // Union field |
Felder | |
---|---|
Union-Feld type_dedicated_config . Konfigurationen für Dokumentverarbeitungstypen. Für type_dedicated_config ist nur einer der folgenden Werte zulässig: |
|
digitalParsingConfig |
Konfigurationen, die auf den digitalen Parser angewendet wurden. |
ocrParsingConfig |
Auf den OCR-Parser angewendete Konfigurationen. Derzeit gilt das nur für PDFs. |
layoutParsingConfig |
Auf den Layoutparser angewendete Konfigurationen. |
DigitalParsingConfig
Dieser Typ hat keine Felder.
Die Konfigurationen für das digitale Parsen von Dokumenten.
OcrParsingConfig
Die OCR-Parsing-Konfigurationen für Dokumente.
JSON-Darstellung |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
Felder | |
---|---|
enhancedDocumentElements[] |
[VERWORFEN] Die Verwendung dieses Feldes wurde eingestellt. Wenn Sie die zusätzliche Verarbeitung erweiterter Dokumentelemente nutzen möchten, wechseln Sie zu |
useNativeText |
Wenn „true“ festgelegt ist, wird auf Seiten mit nativem Text nativer Text anstelle von OCR-Text verwendet. |
LayoutParsingConfig
Die Konfigurationen für das Parsen des Layouts von Dokumenten.
JSON-Darstellung |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
Felder | |
---|---|
enableTableAnnotation |
Optional. Wenn „true“, wird der Tabelle während des Parsens eine LLM-basierte Annotation hinzugefügt. |
enableImageAnnotation |
Optional. Wenn „true“, wird dem Bild während des Parsens die LLM-basierte Annotation hinzugefügt. |
structuredContentTypes[] |
Optional. Enthält die erforderlichen Strukturtypen, die aus dem Dokument extrahiert werden sollen. Unterstützte Werte:
|
excludeHtmlElements[] |
Optional. Liste der HTML-Elemente, die aus den geparsten Inhalten ausgeschlossen werden sollen. |
excludeHtmlClasses[] |
Optional. Liste der HTML-Klassen, die aus dem geparsten Inhalt ausgeschlossen werden sollen. |
excludeHtmlIds[] |
Optional. Liste der HTML-IDs, die aus den geparsten Inhalten ausgeschlossen werden sollen. |
enableGetProcessedDocument |
Optional. Bei „true“ wird das verarbeitete Dokument für die GetProcessedDocument API verfügbar gemacht. |
ServingConfigDataStore
Speichert Informationen zu den Bereitstellungskonfigurationen auf DataStore-Ebene.
JSON-Darstellung |
---|
{ "disabledForServing": boolean } |
Felder | |
---|---|
disabledForServing |
Optional. Wenn auf „true“ gesetzt, ist der DataStore nicht für die Bearbeitung von Suchanfragen verfügbar. |
ConfigurableBillingApproach
Konfiguration für den konfigurierbaren Abrechnungsansatz.
Enums | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Standardwert. Nicht konfigurierbarer Abrechnungsansatz für Spark und Nicht-Spark. |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Verwenden Sie die Abrechnung für Abo-Basis und Überschreitung für den Indexierungskern für Speicher ohne Einbettung. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Verwenden Sie die nutzungsbasierte Pay-as-you-go-Abrechnung für das Add-on für eingebetteten Speicher. |
Methoden |
|
---|---|
|
Vervollständigt die angegebene Nutzereingabe mit Keyword-Vorschlägen |
|
Erstellt einen DataStore . |
|
Löscht ein DataStore . |
|
Erstellt einen DataStore . |
|
Erstellt einen CompletionConfig |
|
Erstellt einen DocumentProcessingConfig . |
|
Ruft die SiteSearchEngine ab. |
|
Listet alle DataStore auf, die dem Projekt zugeordnet sind. |
|
Aktualisiert eine DataStore |
|
Trainiert ein benutzerdefiniertes Modell. |
|
Aktualisiert die CompletionConfig . |
|
Aktualisiert den DocumentProcessingConfig . |