Bevor Sie Knowledge Catalog (ehemals Dataplex Universal Catalog) verwenden können, müssen Sie die erforderlichen APIs in Ihrem Google Cloud Projekt aktivieren. In diesem Dokument wird beschrieben, wie Sie die Knowledge Catalog API und andere erforderliche Dienste aktivieren.
Als Sicherheitsmaßnahme kann eine Organisation festlegen, wer die Berechtigung zum Aktivieren von APIs hat. In einigen Fällen wird durch das Aktivieren von APIs die Abrechnung gestartet. Daher können Organisationen den Zugriff einschränken, um Kosten zu kontrollieren. Informationen zur Service Usage in Google Cloudfinden Sie unter Dienste aktivieren und deaktivieren.
Nachdem Sie die APIs aktiviert haben, werden in Knowledge Catalog automatisch aktuelle Metadaten aus unterstützten Google Cloud Datenquellen aufgenommen und verwaltet.
Hinweis
Erstellen Sie ein Google Cloud Projekt und aktivieren Sie die Abrechnung.
Zum Aktivieren und Deaktivieren der Dataplex API benötigen Sie die Rolle Inhaber oder Bearbeiter. Weitere Informationen zu Rollen und Berechtigungen finden Sie unter Zugriffssteuerung mit IAM.
Knowledge Catalog aktivieren
Sie können ein vorhandenes Projekt für Knowledge Catalog verwenden oder ein neues erstellen. Wir empfehlen, ein neues Projekt zu erstellen. Wenn Sie ein neues Google Cloud Projekt oder ein Projekt verwenden, in dem die BigQuery API aktiviert ist, ist die Dataplex API standardmäßig aktiviert. Sie müssen jedoch die Dataproc API und die Dataproc Metastore API aktivieren.
Damit die vom Lake erstellten Ressourcen in Ihrem Projekt getrennt voneinander bleiben, erstellen Sie ein Projekt pro Lake-Instanz.
So erstellen Sie ein Projekt und aktivieren Knowledge Catalog:
- Wählen Sie in der Google Cloud Console ein Projekt aus oder erstellen Sie ein Projekt.
- Stellen Sie sicher, dass die Abrechnung aktiviert ist für Ihr Projekt.
-
Aktivieren Sie die Dataplex API, die Managed Service for Apache Spark API und die Dataproc Metastore API.
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (
roles/serviceusage.serviceUsageAdmin), die die Berechtigungserviceusage.services.enableenthält. Informationen zum Zuweisen von Rollen.
Knowledge Catalog deaktivieren
Wenn Sie Knowledge Catalog in einem Projekt verwenden, in dem auch BigQuery verwendet wird, sollten Sie sich der Auswirkungen auf das BigQuery-Verhalten bewusst sein, wenn Sie Knowledge Catalog deaktivieren.
Führen Sie die folgenden Schritte aus, bevor Sie Knowledge Catalog deaktivieren, um zusätzliche Gebühren zu vermeiden:
Löschen Sie in der Google Cloud Console alle Lake-Instanzen in Ihrem Projekt. Zum Löschen eines Lakes müssen Sie zuerst die einzelnen Assets und Zonen löschen. Weitere Informationen finden Sie unter Lake löschen.
Löschen Sie in der Google Cloud Console alle benutzerdefinierten Eintragsgruppen in Ihrem Projekt. Wenn Sie eine Eintragsgruppe löschen, werden alle Einträge entfernt, die zu dieser Eintragsgruppe gehören. Weitere Informationen finden Sie unter Eintragsgruppe löschen.
Wählen Sie das Projekt aus, in dem die Dataplex API deaktiviert werden soll.
Rufen Sie die Seite Aktivierte APIs und Dienste auf.
Klicken Sie auf Cloud Dataplex API.
Klicken Sie auf API deaktivieren. Bestätigen Sie den Vorgang, wenn Sie dazu aufgefordert werden.
Wiederholen Sie die Schritte, um die folgenden APIs zu deaktivieren:
- Data Lineage API (falls aktiviert)
Nächste Schritte
- Weitere Informationen zum Suchen nach Ressourcen.
- Informationen zum Messen der Datenqualität.
- Informationen zu Konzepten der Katalogverwaltung.
- Schnellstart: Datenherkunft für eine BigQuery-Tabelle nachverfolgen.
- Knowledge Catalog-Anwendungsfälle ausprobieren.