Verbindungsprofile erstellen

Auf dieser Seite wird der Vorbereitungsteil des Migrationsprozesses beschrieben, in dem Sie Datastream-Verbindungsprofile erstellen, die später zum Importieren von Daten aus der mit MongoDB kompatiblen Quelldatenbank in den Cloud Storage-Bucket verwendet werden.

In dieser Phase führen Sie folgende Schritte aus:

  1. Erstellen Sie ein Cloud Storage-Verbindungsprofil für den Cloud Storage-Bucket, den Sie zuvor erstellt haben.
  2. Erstellen Sie ein Verbindungsprofil für die mit MongoDB kompatible Quelldatenbank.

In der gcloud CLI anmelden

Für die in den folgenden Abschnitten beschriebene Migration wird die gcloud CLI verwendet, um die Migrationsschritte zu konfigurieren und auszuführen. Melden Sie sich zuerst bei an Google Cloud und wählen Sie das Projekt aus, in dem die Migrationspipeline gehostet werden soll.

gcloud auth login
gcloud config set project "$PROJECT_ID"

Verbindungsprofil für die Quelldatenbank erstellen

MongoDB auf Compute Engine

Führen Sie den folgenden Befehl aus, um ein Datastream-Verbindungsprofil für die MongoDB-Datenbank zu erstellen, die auf Compute Engine gehostet wird.

Lassen Sie das Flag --mongodb-replica-set im folgenden Befehl weg, wenn Sie eine Verbindung zu einem Shard-Cluster herstellen.

gcloud datastream connection-profiles create "$SRC_CONNECTION_PROFILE_NAME" \
--display-name="$SRC_CONNECTION_PROFILE_NAME" \
--location="$LOCATION" \
--mongodb-username="$MONGODB_USERNAME" \
--mongodb-password="$MONGODB_PASSWORD" \
--mongodb-host-addresses="$MONGODB_IP_ADDRESS" \
--mongodb-replica-set="$REPLICA_SET" \
--private-connection="$PRIVATE_CONNECTION_NAME" \
--mongodb-standard-connection-format \
--type=mongodb \
--mongodb-direct-connection

MongoDB über SSH

In diesem Beispiel wird davon ausgegangen, dass Sie bereits eine SSH-Verbindung konfiguriert haben, entweder direkt zum Computer, auf dem der mit MongoDB kompatible Server gehostet wird, oder über einen Bastion Host.

Führen Sie den folgenden Befehl aus, um ein Datastream-Verbindungsprofil für die MongoDB-Datenbank zu erstellen, die auf Compute Engine gehostet wird.

Lassen Sie das Flag --mongodb-replica-set im folgenden Befehl weg, wenn Sie eine Verbindung zu einem Shard-Cluster herstellen.

Wenn Sie eine Verbindung mit einem SSH-Passwort herstellen möchten, übergeben Sie das Flag --forward-ssh-password anstelle des Flags --forward-ssh-private-key.

gcloud datastream connection-profiles create "$SRC_CONNECTION_PROFILE_NAME" \
--display-name="$SRC_CONNECTION_PROFILE_NAME" \
--location="$LOCATION" \
--mongodb-username="$MONGODB_USERNAME" \
--mongodb-password="$MONGODB_PASSWORD" \
--mongodb-host-addresses="$MONGODB_IP_ADDRESS" \
--mongodb-replica-set="$REPLICA_SET" \
--forward-ssh-hostname="$BASTION_IP_ADDRESS" \
--forward-ssh-port="$BASTION_SSH_PORT" \
--forward-ssh-username="$BASTION_SSH_USERNAME" \
--forward-ssh-private-key="$BASTION_SSH_PRIVATE_KEY" \
--mongodb-standard-connection-format \
--type=mongodb \
--mongodb-direct-connection

Amazon DocumentDB

In diesem Beispiel wird davon ausgegangen, dass Sie die für die Amazon DocumentDB-Verbindung erforderlichen Parameter und Zertifikate erhalten haben für die Amazon DocumentDB-Verbindung.

Aktivieren Sie vor dem Erstellen eines Verbindungsprofils explizit Änderungsstreams in der Amazon DocumentDB-Datenbank. Eine Anleitung zum Aktivieren dieser Funktion finden Sie im Amazon DocumentDB-Änderungsstreams Leitfaden.

Führen Sie den folgenden Befehl aus, um ein Datastream-Verbindungsprofil für Ihre DocumentDB-Datenbank zu erstellen:

gcloud datastream connection-profiles create "$SRC_CONNECTION_PROFILE_NAME" \
--display-name="$SRC_CONNECTION_PROFILE_NAME" \
--location="$LOCATION" \
--mongodb-username="$MONGODB_USERNAME" \
--mongodb-password="$MONGODB_PASSWORD" \
--mongodb-host-addresses="$MONGODB_HOST_ADDRESS" \
--mongodb-replica-set="$REPLICA_SET" \
--forward-ssh-hostname="$BASTION_IP_ADDRESS" \
--forward-ssh-port="$BASTION_SSH_PORT" \
--forward-ssh-username="$BASTION_SSH_USERNAME" \
--forward-ssh-private-key="$BASTION_SSH_PRIVATE_KEY" \
--mongodb-ca-certificate="$DOCUMENT_DB_CA_CERTIFICATE" \
--mongodb-tls \
--mongodb-standard-connection-format \
--type=mongodb \
--mongodb-direct-connection

Azure Cosmos DB

Aktivieren Sie explizit Änderungsstreams für MongoDB in der API von Azure Cosmos DB, um Datastream-Streams zu starten.

Für diesen Schritt muss die Azure CLI installiert sein .

az resource patch --ids "/subscriptions/subscription_id/resourceGroups/resource_group_name/providers/Microsoft.DocumentDB/mongoClusters/vCore_cluster_name" \
--api-version 2024-10-01-preview \
--properties "{\"previewFeatures\": [ \"ChangeStreams\"]}"

Ersetzen Sie subscription_id, resource_group_name und vCore_cluster_name durch die Werte, die Ihrer Azure Cosmos DB-Bereitstellung entsprechen.

Führen Sie den folgenden Befehl aus, um ein Datastream-Verbindungsprofil für die Azure Cosmos DB-Quelle zu erstellen.

In diesem Beispiel wird davon ausgegangen, dass die Quelle über eine öffentliche DNS- oder IP Adresse zugänglich ist, die im MongoDB SRV-Verbindungsformat angegeben werden kann. Außerdem wird davon ausgegangen, dass der Azure Cosmos DB-Server eine Kombination aus Nutzername und Passwort für die Authentifizierung verwendet.

gcloud datastream connection-profiles create "$SRC_CONNECTION_PROFILE_NAME" \
--display-name="$SRC_CONNECTION_PROFILE_NAME" \
--location="$LOCATION" \
--mongodb-username="$MONGODB_USERNAME" \
--mongodb-password="$MONGODB_PASSWORD" \
--mongodb-host-addresses="$MONGODB_HOST_ADDRESS" \
--mongodb-srv-connection-format \
--type=mongodb \
--static-ip-connectivity \
--labels=skip_all_validations=true

MongoDB Atlas

Führen Sie den folgenden Befehl aus, um ein Datastream-Verbindungsprofil für die MongoDB Atlas-Quelldatenbank zu erstellen.

In diesem Beispiel wird davon ausgegangen, dass die Quelle über eine öffentliche DNS- oder IP Adresse zugänglich ist, die im MongoDB SRV-Verbindungsformat angegeben werden kann. Außerdem wird davon ausgegangen, dass der MongoDB Atlas-Server eine Kombination aus Nutzername und Passwort für die Authentifizierung verwendet.

gcloud datastream connection-profiles create "$SRC_CONNECTION_PROFILE_NAME" \
--display-name="$SRC_CONNECTION_PROFILE_NAME" \
--location="$LOCATION" \
--mongodb-username="$MONGODB_USERNAME" \
--mongodb-password="$MONGODB_PASSWORD" \
--mongodb-host-addresses="$MONGODB_HOST_ADDRESS" \
--mongodb-srv-connection-format \
--type=mongodb \
--static-ip-connectivity

Weitere Informationen zum Überwachen der Erstellung von Verbindungsprofilen finden Sie unter Fehlerbehebung.

Cloud Storage-Verbindungsprofil erstellen

Konfigurieren Sie das Datastream-Verbindungsprofil für das Cloud Storage-Ziel, also den Bucket, den Sie zuvor erstellt haben.

gcloud datastream connection-profiles create "$DST_CONNECTION_PROFILE_NAME" \
--display-name="$DST_CONNECTION_PROFILE_NAME" \
--location="$LOCATION" \
--type=google-cloud-storage \
--bucket="$GCS_BUCKET_NAME" \
--root-path="/$GCS_BUCKET_ROOT_PATH"

Weitere Informationen zum Überwachen der Erstellung von Verbindungsprofilen finden Sie unter Fehlerbehebung.

Nächste Schritte

Fahren Sie mit Daten aus der Quelldatenbank importieren fort.