Créer un flux AlloyDB à l'aide du flux automatisé

Cette page explique comment créer un flux AlloyDB pour PostgreSQL à l'aide du flux de configuration automatisé.

La configuration automatisée des flux simplifie le processus de transfert de données des clusters AlloyDB pour PostgreSQL vers BigQuery en réduisant le nombre d'étapes à effectuer. Ce flux vous permet de créer un flux directement à partir de la page de présentation de votre cluster AlloyDB pour PostgreSQL.

Un déploiement AlloyDB pour PostgreSQL se compose d'un cluster principal, qui contient une instance principale. Il peut également inclure des clusters et des instances secondaires. Datastream crée toujours le flux à partir de l'instance principale du cluster principal.

Datastream automatise la sécurisation de la connexion VPC entre le flux et le cluster source, en créant des configurations de base de données et des ressources de connexion de flux.

Avant de commencer

  1. Activez les API Datastream, Connectivité réseau et Compute Engine.
  2. Assurez-vous de disposer des autorisations IAM (Identity and Access Management) requises pour créer et gérer des ressources Datastream. Pour en savoir plus, consultez la section suivante.
  3. Créez et configurez un cluster AlloyDB pour PostgreSQL source pour la réplication. Pour en savoir plus, consultez Configurer une base de données AlloyDB pour PostgreSQL pour la CDC.
  4. Nous vous recommandons d'activer la réplication logique pour votre cluster avant de créer le flux. Si vous n'activez pas la réplication logique, Datastream le fait pour vous, ce qui redémarre votre instance source.

    Pour savoir comment activer la réplication logique pour un cluster AlloyDB pour PostgreSQL, consultez Configurer une base de données AlloyDB pour PostgreSQL pour la CDC.

  5. Assurez-vous que votre cluster source est configuré pour utiliser l'accès aux services privés.

Autorisations requises

Pour utiliser le flux de création de flux automatisé, vous avez besoin des rôles ou autorisations Identity and Access Management (IAM) suivants :

  • serviceusage.services.enable, compute.networkAdmin pour activer les API requises et effectuer les tâches de configuration réseau.
  • alloydb.admin pour les tâches de configuration des clusters et des instances.
  • datastream.admin pour les tâches d'administration que Datastream effectue à votre place.

Si vous choisissez de personnaliser les paramètres du flux, votre utilisateur administrateur de base de données doit également disposer des autorisations GRANT pour le schéma que vous souhaitez répliquer, ainsi que d'autorisations supplémentaires pour les tâches administratives et structurelles dans la base de données source. Connectez-vous à votre base de données source et exécutez la commande suivante :

  GRANT alloydbsuperuser TO "USER_NAME";
  ALTER ROLE "USER_NAME" CREATEROLE;
  GRANT SELECT on ALL TABLES IN SCHEMA "SCHEMA_NAME" to "USER_NAME" WITH GRANT OPTION;
  ALTER DEFAULT PRIVILEGES
  IN SCHEMA "SCHEMA_NAME"
  GRANT SELECT ON TABLES TO "USER_NAME" WITH GRANT OPTION;
  GRANT CREATE ON DATABASE "DATABASE_NAME" TO "USER_NAME";
  

Tables futures

Les tables futures ne sont ajoutées automatiquement au flux que si elles sont créées par l'utilisateur dont vous fournissez les informations de compte pour l'authentification lors du flux automatisé. Si un autre utilisateur crée une table ultérieurement, il doit accorder explicitement l'autorisation SELECT à l'utilisateur lecteur Datastream sur la table.

Créer et démarrer le flux

Pour créer et démarrer un flux :

Console

  1. Accédez à la page de présentation de vos clusters AlloyDB pour PostgreSQL sources.

    Accéder à AlloyDB pour PostgreSQL

  2. Cliquez sur le cluster principal à partir duquel vous souhaitez diffuser des données.

  3. Créez et démarrez automatiquement votre flux de l'une des manières suivantes :

    1. Sur la page Détails du cluster, sous Réplication des données, cliquez sur Démarrer le flux.
    2. Dans la section Intégrations, cliquez sur Démarrer le flux sous Répliquer les données dans BigQuery.
    3. Dans l'onglet Launchpad, sous Intégrer de manière fluide à d'autres produitsGoogle Cloud , cliquez sur Répliquer les données dans BigQuery.
  4. Le volet Démarrer le flux pour répliquer les données s'ouvre.

  5. Sous Paramètres de la diffusion, vérifiez les paramètres par défaut du flux que vous créez.

  6. Pour modifier la base de données source, développez le menu déroulant correspondant et sélectionnez une autre valeur.

  7. Si vous êtes prêt à créer et à démarrer votre diffusion, cliquez sur Démarrer la diffusion.

Si vous devez modifier les paramètres du flux, cliquez sur Personnaliser.

Personnaliser les paramètres de flux

Lorsque vous cliquez sur Personnaliser, la page Personnaliser les paramètres de flux s'affiche. Assurez-vous de disposer des autorisations requises pour personnaliser les paramètres du flux.

Commencer

  1. Sur la page Premiers pas, indiquez le nom de votre flux dans le champ Nom du flux. Le champ ID de flux est renseigné automatiquement.
  2. Dans la section Fournir les détails du compte utilisateur de l'instance, sélectionnez la méthode d'authentification :

    • Authentification IAM pour les bases de données : cette option est disponible si l'identité principale Identity and Access Management (IAM) est attribuée à votre utilisateur. Pour en savoir plus, consultez Comptes principaux IAM. Si vous sélectionnez cette option, vous devez accorder manuellement le rôle alloydbsuperuser et l'autorisation CREATEROLE à votre utilisateur :

      1. Dans la console Google Cloud , accédez à la page Clusters AlloyDB pour PostgreSQL.

      Accéder à AlloyDB pour PostgreSQL

      1. Sélectionnez votre cluster AlloyDB pour PostgreSQL.
      2. Dans le menu de navigation, cliquez sur AlloyDB pour PostgreSQL Studio, puis connectez-vous.
      3. Dans le volet Explorateur, exécutez la requête suivante pour votre utilisateur :
    GRANT alloydbsuperuser TO "USER_NAME";
    ALTER ROLE "USER_NAME" CREATEROLE;
    • Authentification intégrée à la base de données : indiquez le nom d'utilisateur et le mot de passe d'un utilisateur disposant du rôle alloydbsuperuser. Si votre utilisateur ne dispose pas du rôle alloydbsuperuser, suivez les étapes décrites dans la section sur l'authentification IAM de la base de données pour l'attribuer manuellement. Si vous sélectionnez l'authentification de base de données intégrée, assurez-vous également que l'utilisateur dispose des autorisations GRANT sur les tables qu'il souhaite répliquer.
  3. Consultez d'autres détails sur le flux, tels que la région, le chiffrement et les libellés. Développez la section Informations supplémentaires sur le flux pour appliquer les modifications, si nécessaire.

  4. Cliquez sur Continuer.

Configurer la source

  1. Sur la page Configurer la source, sélectionnez la base de données à partir de laquelle vous souhaitez répliquer les données.

  2. La liste Objets sélectionnés sélectionne tous les objets disponibles par défaut. La liste contient les objets pour lesquels vous disposez des autorisations nécessaires pour le streaming. Pour modifier les objets sélectionnés, modifiez les sélections dans la liste.

  3. Examinez les configurations de flux avancées, telles que le mode de remplissage et le nombre maximal de connexions de remplissage simultanées. Développez la section Configurations avancées du flux pour appliquer les modifications, si nécessaire.

  4. Cliquez sur Continuer.

Configurer la destination

  1. Sur la page Configurer la destination, ajustez les paramètres de destination BigQuery si nécessaire. Pour en savoir plus, consultez Configurer des informations sur la destination du flux.

Créer et démarrer le flux

  1. Cliquez sur Créer et démarrer pour créer et démarrer votre flux, ou sur Créer sans démarrer pour créer votre flux et le démarrer ultérieurement dans Datastream.

  2. Vous recevez des notifications concernant les tâches effectuées automatiquement pour vous :

    • Datastream crée les ressources de cloud privé virtuel requises, telles qu'une plage d'adresses IP internes, un sous-réseau et un rattachement de réseau.
    • Datastream configure les tables pour la CDC, les emplacements de réplication et une publication pour toutes les tables de la base de données, et crée un utilisateur Datastream dédié.
    • Datastream crée une configuration de connectivité privée et des profils de connexion source et de destination.
  3. Confirmez que vous souhaitez créer et démarrer votre flux.

Surveiller le flux

Vous pouvez surveiller les informations de base sur le flux depuis la page "Présentation" de l'instance source dans la console Google Cloud . La page affiche des informations telles que l'état du flux, son nom, l'ensemble de données BigQuery de destination et l'identifiant du projet de destination.

Sur la page "Présentation", vous pouvez également effectuer des actions telles que démarrer ou mettre en pause le flux. Pour obtenir des informations de surveillance plus précises, cliquez sur le nom du flux pour accéder à Datastream.

Supprimer le flux

Lorsque vous supprimez un flux que vous avez créé à l'aide du flux automatisé, certaines ressources, telles que l'emplacement de réplication PostgreSQL, sont supprimées automatiquement. Toutefois, vous devez supprimer manuellement certaines ressources :

  • La publication. La publication est créée à l'aide de l'utilisateur administrateur de la base de données et ne peut être supprimée que par son propriétaire, c'est-à-dire, par défaut, l'utilisateur qui l'a créée.
  • Utilisateur lecteur Datastream.
  • Profils de connexion source et de destination Datastream
  • Ressources de connectivité privée.
  • Toutes les ressources réseau créées lors du flux automatisé, telles que le sous-réseau et l'association réseau.

Étapes suivantes