Ressource: Dokument
In einem Dokument werden alle Rohmetadaten der Elemente erfasst, die empfohlen oder gesucht werden sollen.
| JSON-Darstellung |
|---|
{ "name": string, "id": string, "schemaId": string, "content": { object ( |
| Felder | |
|---|---|
name |
Nicht veränderbar. Der vollständige Ressourcenname des Dokuments. Format: Dieses Feld muss einen UTF-8-codierten String mit maximal 1.024 Zeichen enthalten. |
id |
Nicht veränderbar. Die Kennung des Dokuments. Die ID sollte dem RFC-1034-Standard entsprechen und darf maximal 128 Zeichen lang sein. |
schemaId |
Die Kennung des Schemas, das sich im selben Datenspeicher befindet. |
content |
Die mit diesem Dokument verknüpften unstrukturierten Daten. Inhalte können nur festgelegt werden und müssen festgelegt werden, wenn sich dieses Dokument in einem |
parentDocumentId |
Die Kennung des übergeordneten Dokuments. Derzeit werden nur Dokumenthierarchien mit maximal zwei Ebenen unterstützt. Die ID sollte dem RFC-1034-Standard entsprechen und darf maximal 63 Zeichen lang sein. |
derivedStructData |
Nur Ausgabe. Dieses Feld ist OUTPUT_ONLY. Es enthält abgeleitete Daten, die nicht im ursprünglichen Eingabedokument enthalten sind. |
aclInfo |
Informationen zur Zugriffssteuerung für das Dokument. |
indexTime |
Nur Ausgabe. Der Zeitpunkt, an dem das Dokument zuletzt indexiert wurde. Wenn dieses Feld ausgefüllt ist, wurde das Dokument indexiert. Dokumente sind in der Regel innerhalb von Sekunden nach der Indexierung durchsuchbar. In manchen Fällen kann es jedoch einige Stunden dauern. Wenn in diesem Feld nichts steht, wurde das Dokument noch nie indexiert. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen enthält. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
indexStatus |
Nur Ausgabe. Der Indexstatus des Dokuments.
|
Union-Feld data. Für die Datendarstellung. Es muss entweder struct_data oder json_data angegeben werden. Andernfalls wird ein Fehler INVALID_ARGUMENT ausgegeben. Für data ist nur einer der folgenden Werte zulässig: |
|
structData |
Die strukturierten JSON-Daten des Dokuments. Muss dem registrierten |
jsonData |
Die JSON-String-Darstellung des Dokuments. Diese Darstellung muss dem registrierten |
Inhalt
Mit diesem Dokument verknüpfte unstrukturierte Daten
| JSON-Darstellung |
|---|
{ "mimeType": string, // Union field |
| Felder | |
|---|---|
mimeType |
Der MIME-Typ des Inhalts. Unterstützte Datentypen:
Die folgenden Typen werden nur unterstützt, wenn der Layoutparser im Datenspeicher aktiviert ist:
Siehe https://www.iana.org/assignments/media-types/media-types.xhtml. |
Union-Feld content. Der Inhalt des nicht strukturierten Dokuments. Für content ist nur einer der folgenden Werte zulässig: |
|
rawBytes |
Der Inhalt, dargestellt als Bytestream. Die maximale Länge beträgt 1.000.000 Bytes (1 MB bzw. ~0,95 MiB). Hinweis: Wie bei allen Ein base64-codierter String. |
uri |
Der URI des Inhalts. Es werden nur Cloud Storage-URIs unterstützt, z. B. |
AclInfo
ACL-Informationen des Dokuments
| JSON-Darstellung |
|---|
{
"readers": [
{
object ( |
| Felder | |
|---|---|
readers[] |
Leser des Dokuments |
AccessRestriction
AclRestriction zum Modellieren komplexer Einschränkungen für die Übernahme.
Beispiel: Modellieren einer „Both Permit“-Übernahme, bei der ein Nutzer Zugriff auf das übergeordnete Dokument benötigt, um auf ein untergeordnetes Dokument zugreifen zu können.
Dokumenthierarchie: Space_S –> Page_P
Leser: Space_S: group_1, user_1; Page_P: group_2, group_3, user_2
Space_S-ACL-Einschränkung – { "aclInfo": { "readers": [ { "principals": [ { "groupId": "group_1" }, { "userId": "user_1" } ] } ] } }
Page_P-ACL-Einschränkung. { "aclInfo": { "readers": [ { "principals": [ { "groupId": "group_2" }, { "groupId": "group_3" }, { "userId": "user_2" } ], }, { "principals": [ { "groupId": "group_1" }, { "userId": "user_1" } ], } ] } }
| JSON-Darstellung |
|---|
{
"principals": [
{
object ( |
| Felder | |
|---|---|
principals[] |
Die Liste der Hauptkonten. |
idpWide |
Alle Nutzer innerhalb des Identitätsanbieters. |
Prinzipal
Die Prinzipal-ID eines Nutzers oder einer Gruppe.
| JSON-Darstellung |
|---|
{ // Union field |
| Felder | |
|---|---|
Union-Feld principal. Union-Feld „principal“. Der Prinzipal kann ein Nutzer oder eine Gruppe sein. Für principal ist nur einer der folgenden Werte zulässig: |
|
userId |
Nutzer-ID. Bei einem Google Workspace-Nutzerkonto ist „userId“ die E‑Mail-Adresse des Google Workspace-Nutzers. Bei einem Nutzerkonto eines anderen Identitätsanbieters als Google ist „userId“ die zugeordnete Nutzer-ID, die bei der Konfiguration des Personalpools konfiguriert wurde. |
groupId |
Gruppen-ID. Bei einem Google Workspace-Nutzerkonto ist „groupId“ die E‑Mail-Adresse der Google Workspace-Gruppe. Bei einem Nutzerkonto eines anderen Identitätsanbieters als Google ist „groupId“ die zugeordnete Gruppen-ID, die bei der Konfiguration des Personalpools konfiguriert wurde. |
externalEntityId |
Für Identitäten von Drittanbieteranwendungen, die nicht im Identitätsanbieter des Kunden vorhanden sind |
IndexStatus
Der Indexstatus des Dokuments.
| JSON-Darstellung |
|---|
{
"indexTime": string,
"errorSamples": [
{
object ( |
| Felder | |
|---|---|
indexTime |
Der Zeitpunkt, an dem das Dokument indexiert wurde. Wenn dieses Feld ausgefüllt ist, wurde das Dokument indexiert. Dokumente sind in der Regel innerhalb von Sekunden nach der Indexierung durchsuchbar. In manchen Fällen kann es jedoch einige Stunden dauern. Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: |
errorSamples[] |
Ein Beispiel für Fehler, die beim Indexieren des Dokuments aufgetreten sind. Wenn dieses Feld ausgefüllt ist, wurde das Dokument aufgrund von Fehlern nicht indexiert. |
pendingMessage |
Nicht veränderbar. Die Meldung gibt an, dass das Dokument gerade indexiert wird. Wenn dieses Feld ausgefüllt ist, steht die Indexierung des Dokuments noch aus. |
Methoden |
|
|---|---|
|
Erstellt ein Document-Element. |
|
Löscht ein Document-Element. |
|
Ruft ein Document ab. |
|
Ruft die geparsten Layoutinformationen für ein Document ab. |
|
Bulk-Import mehrerer Documents. |
|
Ruft eine Liste der Document-Elemente ab. |
|
Aktualisiert ein Document-Element. |
|
Löscht alle ausgewählten Document-Elmente in einem Zweig endgültig. |