- Ressource: DataStore
- JSON-Darstellung
- ContentConfig
- AdvancedSiteSearchConfig
- LanguageInfo
- NaturalLanguageQueryUnderstandingConfig
- Modus
- BillingEstimation
- WorkspaceConfig
- Typ
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- Methoden
Ressource: DataStore
DataStore erfasst globale Einstellungen und Konfigurationen auf DataStore-Ebene.
| JSON-Darstellung |
|---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
| Felder | |
|---|---|
name |
Nicht veränderbar. ID. Der vollständige Ressourcenname des Datenspeichers. Format: Dieses Feld muss ein UTF-8-codierter String mit einer Längenbeschränkung von 1.024 Zeichen sein. |
displayName |
Erforderlich. Der Anzeigename des Datenspeichers Dieses Feld muss ein UTF-8-codierter String mit einer Längenbeschränkung von 128 Zeichen sein. Andernfalls wird der Fehler INVALID_ARGUMENT zurückgegeben. |
industryVertical |
Nicht veränderbar. Die Branche, in der der Datenspeicher registriert ist |
solutionTypes[] |
Die Lösungen, für die der Datenspeicher registriert ist. Verfügbare Lösungen für jede
|
defaultSchemaId |
Nur Ausgabe. Die ID des Standard- |
contentConfig |
Nicht veränderbar. Die Inhaltskonfiguration des Datenspeichers. Wenn dieses Feld nicht festgelegt ist, wird standardmäßig |
createTime |
Nur Ausgabe. Zeitstempel für die Erstellung von Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
advancedSiteSearchConfig |
Optional. Konfiguration für die erweiterte Websitesuche |
languageInfo |
Sprachinformationen für DataStore |
naturalLanguageQueryUnderstandingConfig |
Optional. Konfiguration für die Interpretation von Anfragen in natürlicher Sprache |
kmsKeyName |
Nur Eingabe. Der KMS-Schlüssel, der zum Schutz dieses Datenspeichers bei der Erstellung verwendet werden soll Muss für Anfragen festgelegt werden, die den Schutzmaßnahmen der CMEK-Organisationsrichtlinien entsprechen müssen Wenn dieses Feld festgelegt und erfolgreich verarbeitet wird, wird der DataStore durch den KMS-Schlüssel geschützt, wie im Feld „cmekConfig“ angegeben. |
cmekConfig |
Nur Ausgabe. CMEK-bezogene Informationen für den DataStore |
billingEstimation |
Nur Ausgabe. Schätzung der Datengröße für die Abrechnung |
aclEnabled |
Nicht veränderbar. Gibt an, ob Daten in Wenn die ACL für Derzeit wird ACL nur in der Branche |
workspaceConfig |
Konfiguration zum Speichern der Datenspeichertyp-Konfiguration für Arbeitsbereichsdaten. Diese muss festgelegt werden, wenn |
documentProcessingConfig |
Konfiguration für das Verständnis und die Anreicherung von Dokumenten |
startingSchema |
Das Startschema, das für diesen Dieses Feld wird nur von der Das bereitgestellte Schema wird anhand bestimmter Schemaregeln validiert. Weitere Informationen finden Sie in diesem Dokument. |
healthcareFhirConfig |
Optional. Konfiguration für die Branche |
servingConfigDataStore |
Optional. Speichert die Bereitstellungskonfiguration auf DataStore-Ebene |
identityMappingStore |
Nicht veränderbar. Der vollständig qualifizierte Ressourcenname des zugehörigen |
isInfobotFaqDataStore |
Optional. Wenn festgelegt, ist dieser DataStore ein Infobot-FAQ-DataStore. |
configurableBillingApproach |
Optional. Konfiguration für den konfigurierbaren Abrechnungsansatz Siehe |
ContentConfig
Inhaltskonfiguration des Datenspeichers
| Enums | |
|---|---|
CONTENT_CONFIG_UNSPECIFIED |
Standardwert |
NO_CONTENT |
Enthält nur Dokumente ohne Document.content |
CONTENT_REQUIRED |
Enthält nur Dokumente mit Document.content |
PUBLIC_WEBSITE |
Der Datenspeicher wird für die Suche auf öffentlichen Websites verwendet. |
GOOGLE_WORKSPACE |
Der Datenspeicher wird für die Suche im Arbeitsbereich verwendet. Details zum Arbeitsbereich-Datenspeicher werden in der WorkspaceConfig angegeben. |
AdvancedSiteSearchConfig
Konfigurationsdaten für die erweiterte Websitesuche.
| JSON-Darstellung |
|---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
| Felder | |
|---|---|
disableInitialIndex |
Bei Festlegung auf „true“ wird die Erstindexierung für den DataStore deaktiviert. |
disableAutomaticRefresh |
Bei Festlegung auf „true“ wird die automatische Aktualisierung für den DataStore deaktiviert. |
LanguageInfo
Sprachinformationen für DataStore
| JSON-Darstellung |
|---|
{ "languageCode": string, "normalizedLanguageCode": string, "language": string, "region": string } |
| Felder | |
|---|---|
languageCode |
Der Sprachcode für den DataStore |
normalizedLanguageCode |
Nur Ausgabe. Dies ist die normalisierte Form von „languageCode“. Beispiel: Der languageCode |
language |
Nur Ausgabe. Sprachanteil von „normalizedLanguageCode“. Beispiel: |
region |
Nur Ausgabe. Der Regionsteil von „normalizedLanguageCode“, falls vorhanden. Beispiel: |
NaturalLanguageQueryUnderstandingConfig
Konfiguration für die Interpretation von Anfragen in natürlicher Sprache
| JSON-Darstellung |
|---|
{
"mode": enum ( |
| Felder | |
|---|---|
mode |
Modus für die Interpretation von Anfragen in natürlicher Sprache. Wenn dieses Feld nicht festgelegt ist, wird standardmäßig |
Modus
Modus für die Interpretation von Anfragen in natürlicher Sprache. Wenn NaturalLanguageQueryUnderstandingConfig.Mode auf ENABLED gesetzt ist, werden die Funktionen für das Verarbeiten von Anfragen in natürlicher Sprache für eine Suchanfrage aktiviert, wenn NaturalLanguageQueryUnderstandingSpec.FilterExtractionCondition in der SearchRequest auf ENABLED gesetzt ist.
| Enums | |
|---|---|
MODE_UNSPECIFIED |
Standardwert |
DISABLED |
Die Interpretation von Anfragen in natürlicher Sprache ist deaktiviert. |
ENABLED |
Die Interpretation von Anfragen in natürlicher Sprache ist aktiviert. |
BillingEstimation
Schätzung der Datengröße pro Datenspeicher
| JSON-Darstellung |
|---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
| Felder | |
|---|---|
structuredDataSize |
Datengröße für strukturierte Daten in Byte |
unstructuredDataSize |
Datengröße für unstrukturierte Daten in Byte |
websiteDataSize |
Datengröße für Websites in Byte |
structuredDataUpdateTime |
Zeitstempel der letzten Aktualisierung der strukturierten Daten Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
unstructuredDataUpdateTime |
Zeitstempel der letzten Aktualisierung für unstrukturierte Daten Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
websiteDataUpdateTime |
Zeitstempel der letzten Aktualisierung für Websites Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
WorkspaceConfig
Konfiguration zum Speichern der Datenspeichertypkonfiguration für Arbeitsbereichsdaten
| JSON-Darstellung |
|---|
{
"type": enum ( |
| Felder | |
|---|---|
type |
Die Google Workspace-Datenquelle |
dasherCustomerId |
Verschleierte Dasher-Kundennummer |
superAdminServiceAccount |
Optional. Das Super Admin-Dienstkonto für den Arbeitsbereich, der zum Generieren von Zugriffstokens verwendet wird. Derzeit wird es nur für die Datenaufnahme mit dem nativen Google Drive-Connector verwendet. |
superAdminEmailAddress |
Optional. Die E‑Mail-Adresse des Super Admins für den Arbeitsbereich, der für die Generierung des Zugriffstokens verwendet wird. Derzeit wird es nur für die Datenaufnahme mit dem nativen Google Drive-Connector verwendet. |
Typ
Gibt den Typ der Workspace-App an, die von diesem Datenspeicher unterstützt wird
| Enums | |
|---|---|
TYPE_UNSPECIFIED |
Standardmäßig wird ein nicht angegebener Workspace-Typ verwendet. |
GOOGLE_DRIVE |
Workspace-Datenspeicher enthält Drive-Daten |
GOOGLE_MAIL |
Workspace-Datenspeicher enthält Mail-Daten |
GOOGLE_SITES |
Workspace-Datenspeicher enthält Sites-Daten |
GOOGLE_CALENDAR |
Workspace-Datenspeicher enthält Kalenderdaten |
GOOGLE_CHAT |
Workspace-Datenspeicher enthält Chat-Daten |
GOOGLE_GROUPS |
Workspace-Datenspeicher enthält Gruppendaten |
GOOGLE_KEEP |
Workspace-Datenspeicher enthält Keep-Daten |
GOOGLE_PEOPLE |
Workspace-Datenspeicher enthält Personendaten |
DocumentProcessingConfig
Eine Singleton-Ressource von DataStore. Wenn das Feld leer ist, wenn DataStore erstellt wird und DataStore auf DataStore.ContentConfig.CONTENT_REQUIRED gesetzt ist, wird standardmäßig der digitale Parser verwendet.
| JSON-Darstellung |
|---|
{ "name": string, "chunkingConfig": { object ( |
| Felder | |
|---|---|
name |
Der vollständige Ressourcenname der Konfiguration für die Dokumentverarbeitung. Format: |
chunkingConfig |
Gibt an, ob der Blockaufteilungsmodus aktiviert ist |
defaultParsingConfig |
Konfigurationen für den Standardparser für Dokumente. Wenn dies nicht angegeben ist, wird die Standard-DigitalParsingConfig konfiguriert und die Standardkonfiguration für das Parsing wird auf alle Dateitypen für das Parsing von Dokumenten angewendet. |
parsingConfigOverrides |
Zuordnung vom Dateityp zum Überschreiben der Standardkonfiguration für das Parsing basierend auf dem Dateityp. Unterstützte Schlüssel:
|
ChunkingConfig
Konfiguration für die Blockaufteilungskonfiguration
| JSON-Darstellung |
|---|
{ // Union field |
| Felder | |
|---|---|
Union-Feld chunk_mode. Zusätzliche Konfigurationen, die das Verhalten der Blockaufteilung definieren. Für chunk_mode ist nur einer der folgenden Werte zulässig: |
|
layoutBasedChunkingConfig |
Konfiguration für die layoutbasierte Blockaufteilung |
LayoutBasedChunkingConfig
Konfiguration für die layoutbasierte Blockaufteilung
| JSON-Darstellung |
|---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
| Felder | |
|---|---|
chunkSize |
Das Tokengrößenlimit für jeden Block Unterstützte Werte: 100–500 (einschließlich). Standardwert: 500 |
includeAncestorHeadings |
Gibt an, ob verschiedene Überschriftenebenen an Blöcke aus der Mitte des Dokuments angehängt werden sollen, um Kontextverlust zu verhindern Standardwert: False |
ParsingConfig
Zugehörige Konfigurationen, die auf einen bestimmten Dokumentparser angewendet werden
| JSON-Darstellung |
|---|
{ // Union field |
| Felder | |
|---|---|
Union-Feld type_dedicated_config. Konfigurationen für Dokumentverarbeitungstypen. Für type_dedicated_config ist nur einer der folgenden Werte zulässig: |
|
digitalParsingConfig |
Konfigurationen, die auf den digitalen Parser angewendet wurden |
ocrParsingConfig |
Auf den OCR-Parser angewendete Konfigurationen. Derzeit gilt das nur für PDFs. |
layoutParsingConfig |
Auf den Layoutparser angewendete Konfigurationen |
DigitalParsingConfig
Dieser Typ hat keine Felder.
Die Konfigurationen für das digitale Parsing von Dokumenten
OcrParsingConfig
Die OCR-Parsingkonfigurationen für Dokumente
| JSON-Darstellung |
|---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
| Felder | |
|---|---|
enhancedDocumentElements[] |
[VERWORFEN] Dieses Feld wird nicht mehr unterstützt. Wenn Sie die zusätzliche Verarbeitung erweiterter Dokumentelemente nutzen möchten, wechseln Sie zu |
useNativeText |
Wenn „true“ festgelegt ist, wird auf Seiten mit nativem Text nativer Text anstelle von OCR-Text verwendet. |
LayoutParsingConfig
Die Konfigurationen für das Parsing des Layouts von Dokumenten.
| JSON-Darstellung |
|---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
| Felder | |
|---|---|
enableTableAnnotation |
Optional. Bei „true“ wird der Tabelle während des Parsings die LLM-basierte Annotation hinzugefügt. |
enableImageAnnotation |
Optional. Bei „true“ wird dem Bild während des Parsings die LLM-basierte Annotation hinzugefügt. |
structuredContentTypes[] |
Optional. Enthält die erforderlichen Strukturtypen, die aus dem Dokument extrahiert werden sollen. Unterstützte Werte:
|
excludeHtmlElements[] |
Optional. Liste der HTML-Elemente, die aus den geparsten Inhalten ausgeschlossen werden sollen |
excludeHtmlClasses[] |
Optional. Liste der HTML-Klassen, die aus den geparsten Inhalten ausgeschlossen werden sollen |
excludeHtmlIds[] |
Optional. Liste der HTML-IDs, die aus den geparsten Inhalten ausgeschlossen werden sollen |
enableGetProcessedDocument |
Optional. Bei „true“ wird das verarbeitete Dokument für die GetProcessedDocument API verfügbar gemacht. |
HealthcareFhirConfig
Konfiguration für den Datenspeicher für die Branche HEALTHCARE_FHIR
| JSON-Darstellung |
|---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
| Felder | |
|---|---|
enableConfigurableSchema |
Gibt an, ob das konfigurierbare Schema für die Branche Wenn diese Option auf |
enableStaticIndexingForBatchIngestion |
Gibt an, ob die statische Indexierung für die Wenn der Wert auf |
ServingConfigDataStore
Speichert Informationen zu den Bereitstellungskonfigurationen auf DataStore-Ebene
| JSON-Darstellung |
|---|
{ "disabledForServing": boolean } |
| Felder | |
|---|---|
disabledForServing |
Optional. Wenn auf „true“ gesetzt, ist der DataStore nicht für die Bearbeitung von Suchanfragen verfügbar. |
ConfigurableBillingApproach
Konfiguration für den konfigurierbaren Abrechnungsansatz
| Enums | |
|---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
Standardwert. Nicht konfigurierbarer Abrechnungsansatz für Spark und Nicht-Spark |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
Verwenden Sie die Abrechnung für Abobasis und Überschreitung für den Indexierungskern für Speicher ohne Einbettung. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
Verwenden Sie die nutzungsbasierte Pay-as-you-go-Abrechnung für das Add-on für eingebetteten Speicher. |
Methoden |
|
|---|---|
|
Vervollständigt die angegebene Nutzereingabe mit Keyword-Vorschlägen |
|
Erstellt einen DataStore |
|
Löscht einen DataStore |
|
Ruft einen DataStore ab |
|
Ruft die SiteSearchEngine ab |
|
Listet alle DataStores auf, die dem Projekt zugeordnet sind |
|
Aktualisiert einen DataStore |
|
Trainiert ein benutzerdefiniertes Modell |