Auf dieser Seite wird beschrieben, wie Sie die Zugriffssteuerung für Datenquellen (auch als ACLs bezeichnet) für Suchanwendungen erzwingen, die Sie mit Cloud Storage oder BigQuery erstellen.
Übersicht
Die Zugriffssteuerung für Ihre Datenquellen in Gemini Enterprise begrenzt die Daten, die Nutzer in den Ergebnissen Ihrer Suchanwendung sehen können. Google verwendet Ihren Identitätsanbieter, um den Endnutzer zu identifizieren, der eine Suche durchführt, und um festzustellen, ob dieser Zugriff auf die Dokumente hat, die als Ergebnisse zurückgegeben werden.
Angenommen, Mitarbeiter in Ihrem Unternehmen suchen mit Ihrer Suchanwendung in BigQuery-Dokumenten. Sie müssen jedoch dafür sorgen, dass sie über die Anwendung keine Inhalte aufrufen können, auf die sie keinen Zugriff haben dürfen. Wenn Sie einen Google Cloud Personalpool für den Identitätsanbieter Ihrer Organisation eingerichtet haben, können Sie diesen Personalpool auch in Gemini Enterprise angeben. Wenn ein Mitarbeiter Ihre Anwendung verwendet, erhält er jetzt nur Suchergebnisse für Dokumente, auf die sein Konto in BigQuery bereits Zugriff hat.
Das Aktivieren der Zugriffssteuerung ist ein einmaliger Vorgang. So wenden Sie die Zugriffssteuerung auf eine BigQuery- oder Cloud Storage-Datenquelle an:
- Unstrukturierte Daten aus Cloud Storage
- Strukturierte Daten aus Cloud Storage
- Unstrukturierte Daten aus BigQuery
- Strukturierte Daten aus BigQuery
Unstrukturierte Daten aus Cloud Storage
Wenn Sie einen Datenspeicher für unstrukturierte Daten aus Cloud Storage einrichten, müssen Sie auch ACL-Metadaten hochladen und den Datenspeicher als zugriffsgesteuert festlegen:
Fügen Sie beim Vorbereiten Ihrer Daten ACL-Informationen in Ihre Metadaten ein. Verwenden Sie dazu das Feld
acl_info. Beispiel:{ "id": "<your-id>", "jsonData": "<JSON string>", "content": { "mimeType": "<application/pdf or text/html>", "uri": "gs://<your-gcs-bucket>/directory/filename.pdf" }, "acl_info": { "readers": [ { "principals": [ { "group_id": "group_1" }, { "user_id": "user_1" } ] } ] } }Weitere Informationen zu unstrukturierten Daten mit Metadaten finden Sie im Abschnitt „Unstrukturierte Daten“ unter Daten für die Aufnahme vorbereiten.
Wenn Sie die Schritte zum Erstellen eines Datenspeichers unter Erstellen eines Datenspeichers für selbst erhobene Daten ausführen, können Sie so die Zugriffssteuerung über die Console oder die API aktivieren:
- Console: Wählen Sie beim Erstellen eines Datenspeichers die Option Dieser Datenspeicher enthält Informationen zur Zugriffssteuerung aus.
- API: Wenn Sie einen Datenspeicher erstellen, fügen Sie das Feld
"aclEnabled": "true"in Ihre JSON-Nutzlast ein.
Wenn Sie den Schritten zum Datenimport unter Erstellen eines Datenspeichers für selbst erhobene Daten folgen, achten Sie auf Folgendes:
- Laden Sie Metadaten mit ACL-Informationen aus demselben Bucket wie Ihre unstrukturierten Daten hoch.
- Wenn Sie die API verwenden, legen Sie
GcsSource.dataSchemaaufdocumentfest.
Strukturierte Daten aus Cloud Storage
Wenn Sie einen Datenspeicher für strukturierte Daten aus Cloud Storage einrichten, müssen Sie auch ACL-Metadaten hochladen und den Datenspeicher als zugriffsgesteuert festlegen:
Fügen Sie beim Vorbereiten Ihrer Daten ACL-Informationen in Ihre Metadaten ein. Verwenden Sie dazu das Feld
acl_info. Beispiel:{ "id": "<your-id>", "jsonData": "<JSON string>", "acl_info": { "readers": [ { "principals": [ { "group_id": "group_1" }, { "user_id": "user_1" } ] } ] } }Wenn Sie die Schritte zum Erstellen eines Datenspeichers unter Erstellen eines Datenspeichers für selbst erhobene Daten ausführen, können Sie so die Zugriffssteuerung über die Console oder die API aktivieren:
- Console: Wählen Sie beim Erstellen eines Datenspeichers die Option Dieser Datenspeicher enthält Informationen zur Zugriffssteuerung aus.
- API: Wenn Sie einen Datenspeicher erstellen, fügen Sie das Feld
"aclEnabled": "true"in Ihre JSON-Nutzlast ein.
Wenn Sie den Schritten zum Datenimport unter Erstellen eines Datenspeichers für selbst erhobene Daten folgen, achten Sie auf Folgendes:
- Laden Sie Metadaten mit ACL-Informationen aus demselben Bucket wie Ihre strukturierten Daten hoch.
- Wenn Sie die API verwenden, legen Sie
GcsSource.dataSchemaaufdocumentfest.
Unstrukturierte Daten aus BigQuery
Wenn Sie einen Datenspeicher für unstrukturierte Daten aus BigQuery einrichten, müssen Sie den Datenspeicher als zugriffsgesteuert festlegen und ACL-Metadaten mit einem vordefinierten Schema für Gemini Enterprise bereitstellen:
Geben Sie beim Vorbereiten Ihrer Daten das folgende Schema an. Verwenden Sie kein benutzerdefiniertes Schema.
[ { "name": "id", "mode": "REQUIRED", "type": "STRING", "fields": [] }, { "name": "jsonData", "mode": "NULLABLE", "type": "STRING", "fields": [] }, { "name": "content", "type": "RECORD", "mode": "NULLABLE", "fields": [ { "name": "mimeType", "type": "STRING", "mode": "NULLABLE" }, { "name": "uri", "type": "STRING", "mode": "NULLABLE" } ] }, { "name": "acl_info", "type": "RECORD", "mode": "NULLABLE", "fields": [ { "name": "readers", "type": "RECORD", "mode": "REPEATED", "fields": [ { "name": "principals", "type": "RECORD", "mode": "REPEATED", "fields": [ { "name": "user_id", "type": "STRING", "mode": "NULLABLE" }, { "name": "group_id", "type": "STRING", "mode": "NULLABLE" } ] } ] } ] } ]Fügen Sie die ACL-Metadaten als Spalte in Ihre BigQuery-Tabelle ein.
Wenn Sie den Schritten unter Erstellen eines Datenspeichers für selbst erhobene Daten folgen, aktivieren Sie die Zugriffssteuerung entweder in der Console oder über die API:
- Console: Wählen Sie beim Erstellen eines Datenspeichers die Option Dieser Datenspeicher enthält Informationen zur Zugriffssteuerung aus.
- API: Wenn Sie einen Datenspeicher erstellen, fügen Sie das Feld
"aclEnabled": "true"in Ihre JSON-Nutzlast ein.
Wenn Sie den Schritten zum Datenimport unter Erstellen eines Datenspeichers für selbst erhobene Daten folgen und die API verwenden, legen Sie
BigQuerySource.dataSchemaaufdocumentfest.
Strukturierte Daten aus BigQuery
Wenn Sie einen Datenspeicher für strukturierte Daten aus BigQuery einrichten, müssen Sie den Datenspeicher als zugriffsgesteuert festlegen und ACL-Metadaten mit einem vordefinierten Schema für Gemini Enterprise bereitstellen:
Geben Sie beim Vorbereiten Ihrer Daten das folgende Schema an. Verwenden Sie kein benutzerdefiniertes Schema.
[ { "name": "id", "mode": "REQUIRED", "type": "STRING", "fields": [] }, { "name": "jsonData", "mode": "NULLABLE", "type": "STRING", "fields": [] }, { "name": "acl_info", "type": "RECORD", "mode": "NULLABLE", "fields": [ { "name": "readers", "type": "RECORD", "mode": "REPEATED", "fields": [ { "name": "principals", "type": "RECORD", "mode": "REPEATED", "fields": [ { "name": "user_id", "type": "STRING", "mode": "NULLABLE" }, { "name": "group_id", "type": "STRING", "mode": "NULLABLE" } ] } ] } ] } ]Fügen Sie die ACL-Metadaten als Spalte in Ihre BigQuery-Tabelle ein.
Wenn Sie den Schritten unter Erstellen eines Datenspeichers für selbst erhobene Daten folgen, aktivieren Sie die Zugriffssteuerung entweder in der Console oder über die API:
- Console: Wählen Sie beim Erstellen eines Datenspeichers die Option Dieser Datenspeicher enthält Informationen zur Zugriffssteuerung aus.
- API: Wenn Sie einen Datenspeicher erstellen, fügen Sie das Feld
"aclEnabled": "true"in Ihre JSON-Nutzlast ein.
Wenn Sie den Schritten zum Datenimport unter Erstellen eines Datenspeichers für selbst erhobene Daten folgen, achten Sie auf Folgendes:
- Wenn Sie die Console verwenden, wählen Sie beim Angeben der Art der Daten, die Sie hochladen, JSONL für strukturierte Daten mit Metadaten aus.
- Wenn Sie die API verwenden, legen Sie
BigQuerySource.dataSchemaaufdocumentfest.