Auf dieser Seite wird beschrieben, wie Sie die Version Ihrer Instanzen oder Batch-Pipelines aktualisieren.
Aktualisieren Sie Ihre Cloud Data Fusion-Instanzen und Batch-Pipelines auf die neuesten Plattform- und Plug-in-Versionen, um die neuesten Funktionen, Fehlerkorrekturen und Leistungsverbesserungen zu erhalten.
Hinweis
- Planen Sie eine geplante Ausfallzeit für das Upgrade. Der Vorgang dauert bis zu einer Stunde.
-
Aktivieren Sie Cloud Shell in der Google Cloud console.
Beschränkungen
Nachdem Sie eine Cloud Data Fusion-Instanz erstellt haben, können Sie ihre Edition nicht mehr ändern, auch nicht durch ein Upgrade.
Lösen Sie kein Upgrade mit Terraform aus, da die Instanz dadurch gelöscht und neu erstellt wird, anstatt ein direktes Upgrade durchzuführen. Dieses Problem führt zum Verlust aller vorhandenen Daten in der Instanz.
Cloud Data Fusion startet keine Pipelines neu, die aufgrund des Upgrades beendet werden.
Wenn Sie ein Upgrade einer Instanz von Versionen vor 6.11.0 durchführen, müssen Sie mit einer längeren Ausfallzeit rechnen, insbesondere wenn die Instanz viele Daten verarbeitet.
Das Upgrade von Echtzeit-Pipelines wird nicht unterstützt, außer bei Pipelines, die in Version 6.8.0 mit einer Kafka-Echtzeitquelle erstellt wurden. Eine Problemumgehung finden Sie unter Echtzeit-Pipelines aktualisieren.
Cloud Data Fusion-Instanzen aktualisieren
Wenn Sie eine Cloud Data Fusion-Instanz auf eine neue Cloud Data Fusion-Version aktualisieren möchten, rufen Sie die Seite Instanzdetails auf:
Rufen Sie in der Google Cloud Console die Seite „Cloud Data Fusion“ auf.
Klicken Sie auf Instanzen und dann auf den Namen der Instanz, um die Seite Instanzdetails aufzurufen.
Führen Sie dann das Upgrade mithilfe der Google Cloud console oder gcloud CLI durch:
Console
Klicken Sie auf Upgrade , um eine Liste der verfügbaren Versionen aufzurufen.
Version auswählen
Klicken Sie auf Upgrade.
Prüfen Sie, ob das Upgrade erfolgreich war:
Aktualisieren Sie die Seite Instanzdetails.
Klicken Sie auf Instanz aufrufen , um auf die aktualisierte Instanz in der Cloud Data Fusion-Weboberfläche zuzugreifen.
Klicken Sie in der Menüleiste auf Systemadministrator.
Die neue Versionsnummer wird oben auf der Seite angezeigt.
Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.
gcloud
Führen Sie in einer lokalen Terminalsitzung Cloud Shell den folgenden gcloud CLI-Befehl aus, um ein Upgrade auf eine neue Cloud Data Fusion-Version durchzuführen:
gcloud beta data-fusion instances update INSTANCE_ID \ --project=PROJECT_ID \ --location=LOCATION_NAME \ --version=AVAILABLE_INSTANCE_VERSIONOptional: Fügen Sie gegebenenfalls die
--enable_stackdriver_logging,--enable_stackdriver_monitoringund--labelsFlags für Ihre Instanz hinzu.Optional: Sie können die CDAP-Attribute wie
enable.unrecoverable.reset, als--optionsübergeben.
Prüfen Sie so, ob das Upgrade erfolgreich war:
Rufen Sie in der Google Cloud console die Seite Instanzen von Cloud Data Fusion auf.
Klicken Sie auf Instanz aufrufen , um auf die aktualisierte Instanz in der Cloud Data Fusion-Weboberfläche zuzugreifen.
Klicken Sie in der Menüleiste auf Systemadministrator.
Die neue Versionsnummer wird oben auf der Seite angezeigt.
Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.
Batch-Pipelines aktualisieren
So aktualisieren Sie Ihre Cloud Data Fusion-Batchpipelines auf die neuesten Plug-in-Versionen:
Empfohlen:Sichern Sie alle Pipelines. Sie haben zwei Möglichkeiten, Pipelines zu sichern:
Laden Sie die ZIP-Datei so herunter:
- Sichern Sie alle Pipelines mit dem folgenden Befehl, um einen ZIP-Datei-Download auszulösen:
echo $CDAP_ENDPOINT/v3/export/apps- Kopieren Sie die URL-Ausgabe in Ihren Browser.
- Entpacken Sie die heruntergeladene Datei und prüfen Sie, ob alle Pipelines exportiert wurden. Die Pipelines sind nach Namespace organisiert.
Sichern Sie Pipelines mit der Quellcodeverwaltung (Source Control Management, SCM), die in Version 6.9 und höher verfügbar ist. SCM bietet eine GitHub-Integration, mit der Sie Pipelines sichern können.
So aktualisieren Sie Pipelines:
Erstellen Sie eine Variable, die auf die Datei
pipeline_upgrade.jsonverweist. Diese Datei erstellen Sie im nächsten Schritt, um eine Liste von Pipelines zu speichern.export PIPELINE_LIST=PATH/pipeline_upgrade.jsonErsetzen Sie PATH durch den Pfad zur Datei.
Erstellen Sie mit dem folgenden Befehl eine Liste aller Pipelines für eine Instanz und einen Namespace. Das Ergebnis wird in der Datei
$PIPELINE_LISTimJSON-Format gespeichert. Sie können die Liste bearbeiten, um Pipelines zu entfernen, die nicht aktualisiert werden müssen.curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/apps -o $PIPELINE_LISTErsetzen Sie NAMESPACE_ID durch den Namespace, in dem das Upgrade ausgeführt werden soll.
Führen Sie ein Upgrade für die in
pipeline_upgrade.jsonaufgeführten Pipelines aus. Fügen Sie die NAMESPACE_ID der Pipelines ein, die aktualisiert werden sollen. Der Befehl zeigt eine Liste der aktualisierten Pipelines mit dem Upgradestatus an.curl -N -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/upgrade --data @$PIPELINE_LISTErsetzen Sie NAMESPACE_ID durch die Namespace-ID der Pipelines , die aktualisiert werden.
Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen zu in der aktualisierten Instanz.
Echtzeit-Pipelines aktualisieren
Das Upgrade von Echtzeit-Pipelines wird nicht unterstützt, außer bei Pipelines, die in Version 6.8.0 mit einer Kafka-Echtzeitquelle erstellt wurden.
In allen anderen Fällen gehen Sie so vor:
- Beenden und exportieren Sie die Pipelines.
- Führen Sie ein Upgrade der Instanz durch.
- Importieren Sie die Echtzeit-Pipelines in Ihre aktualisierte Instanz.
Upgrade zur Aktivierung der Replikation
Die Replikation kann in Cloud Data Fusion-Umgebungen ab Version 6.3.0 aktiviert werden. Wenn Sie Version 6.2.3 verwenden, führen Sie ein Upgrade auf Version 6.3.0 und dann auf die neueste Version durch. Anschließend können Sie die Replikation aktivieren.
Rollen für aktualisierte Instanzen zuweisen
Weisen Sie nach Abschluss des Upgrades die
Rolle „Cloud Data Fusion-Runner“
(roles/datafusion.runner) und die
Rolle „Cloud Storage-Administrator“
(roles/storage.admin) für das Managed Service for Apache Spark-Dienstkonto in Ihrem
Projekt zu.
Nächste Schritte
- Patch-Revisionen für Cloud Data Fusion-Instanzen verwalten.
- Erfahren Sie mehr über die Versionsverwaltung in Cloud Data Fusion.
- Siehe die verfügbaren Versions- und Patch-Revisions-Upgrades.
- Fehlerbehebung bei Upgrades.