Auf dieser Seite wird erläutert, wie Sie eine Instanz von Cloud Data Fusion erstellen.
Vorbereitung
- Aktivieren Sie die Cloud Data Fusion API.
- Zum Erstellen von Cloud Data Fusion-Instanzen ist die folgende Berechtigung erforderlich:
instances.create. Weitere Informationen finden Sie unter Zugriffssteuerung. - Cloud Data Fusion-Instanzen müssen als Compute Engine-Standarddienstkonto ausgeführt werden. Informationen zu den verfügbaren Typen und Rollen finden Sie unter Dienstkonten.
- Cloud Data Fusion führt standardmäßig Pipelines mithilfe eines Managed Service for Apache Spark-Clusters in Ihrem Projekt aus. Prüfen Sie, ob Ihr Projekt die Netzwerkanforderungen für Managed Service for Apache Spark erfüllt.
- Neue Projekte beginnen mit einem Standardnetzwerk. Das Standardnetzwerk enthält bereits die Firewallregel default-allow-ssh, die eingehende Verbindungen am TCP-Port 22 von jeder Quelle zu jeder Instanz im Netzwerk zulässt. Wenn bei Versionen, die älter als 6.2.0 sind, diese Regel, eingehenden Traffic an TCP Port 22 zu erlauben, in dem von Ihrer Cloud Data Fusion Instanz verwendeten Netzwerk nicht vorhanden ist, müssen Sie diese Regel erstellen.
Instanz erstellen
Console
Wenn die API aktiviert ist, wird im Abschnitt „Cloud Data Fusion“ in der Google Cloud Console die Instanzen Seite angezeigt, auf der Sie Cloud Data Fusion-Instanzen erstellen und verwalten können.
- Rufen Sie in der Console die Seite „Cloud Data Fusion“ auf.
- Klicken Sie auf Instanzen und dann auf Instanz erstellen.
- Geben Sie einen Instanznamen ein.
- Geben Sie eine Beschreibung für Ihre Instanz ein.
- Geben Sie die Region an, in der die Instanz erstellt werden soll.
- Geben Sie die Version von Cloud Data Fusion an.
- Wählen Sie eine Edition aus. Die Standardeinstellung ist Basic.
- Optional: Klicken Sie auf Beschleuniger hinzufügen , um Beschleuniger auszuwählen, die in Ihrer Instanz verwendet werden sollen.
- Geben Sie das Managed Service for Apache Spark-Dienstkonto an, das zum Ausführen Ihrer Cloud Data Fusion-Pipeline in Managed Service for Apache Spark verwendet werden soll. Die Standardeinstellung ist das Compute Engine-Konto. Sorgen Sie unabhängig von der Version dafür, dass ein Dienstkonto die entsprechenden Rollen für Identity and Access Management hat. Weitere Informationen finden Sie unter Berechtigungen für Dienstkontonutzer erteilen.
Optional: Geben Sie erweiterte Optionen an. Wenn Sie nichts angeben, werden die folgenden Standardeinstellungen verwendet:
Kategorie Einstellung Beschreibung Standard Private IP Interne IP-Adressen aktivieren Erstellen Sie die Cloud Data Fusion-Instanz mit einer internen IP-Adresse. Deaktiviert Erweitertes Monitoring und Logging Cloud Logging für Managed Service for Apache Spark aktivieren
Cloud Monitoring für Managed Service for Apache Spark aktivieren
Erweiterte Pipeline-Logs in Cloud Logging ansehen. Deaktiviert Einbindung von Knowledge Catalog-Datenherkunft Einbindung in Knowledge Catalog Datenherkunft aktivieren oder deaktivieren Herkunft in Knowledge Catalog ansehen. Deaktiviert Verschlüsselung Vom Kunden verwalteten Verschlüsselungsschlüssel (CMEK) verwenden Rollenbasierte Zugriffssteuerung in Version 6.5 und höher verwenden. Deaktiviert Labels Ein Schlüssel/Wert-Paar Die Ressourcenlabels für die Instanz, die zum Annotieren zugehöriger zugrunde liegender Ressourcen wie Compute Engine VMs verwendet werden. Labelschlüssel und Labelwerte dürfen nur Buchstaben, Zahlen, Bindestriche und Unterstriche enthalten. Labelschlüssel müssen mit einem Buchstaben oder einer Zahl beginnen. Keine Wartung Wartungsfenster aktivieren Legen Sie das Zeitfenster fest, in dem Cloud Data Fusion Wartungsvorgänge für die Instanz ausführen kann. Weitere Informationen finden Sie unter Wartungsfenster konfigurieren. Deaktiviert Klicken Sie auf Erstellen. Es kann bis zu 30 Minuten dauern, bis die Instanz erstellt ist.
Während Cloud Data Fusion die Instanz erstellt, wird neben dem Instanznamen auf der Seite Instanzen ein Radsymbol angezeigt, das den Fortschritt angibt. Nachdem der Vorgang abgeschlossen ist, wird es zu einem grünen Häkchen. Dies zeigt an, dass Sie die Instanz verwenden können.
API
Instanz erstellen:
Wenn Sie eine Cloud Data Fusion-Instanz mit der Cloud Data Fusion REST API erstellen möchten, erstellen Sie eine instances.create API-Anfrage, indem Sie die Instance-Ressource mit Ihren Konfigurationsinformationen ausfüllen.
Nächste Schritte
- Weitere Informationen über Cloud Data Fusion
- Anleitung durcharbeiten