本页介绍了如何使用自动化设置流程创建直播。
自动设置流可减少您需要执行的步骤,从而简化将数据从 Cloud SQL for PostgreSQL 托管式数据库迁移到 BigQuery 的过程。借助此流程,您可以直接从 Cloud SQL for PostgreSQL 实例的概览页面创建流。 Datastream 可自动确保数据流与源数据库之间的 VPC 连接安全无虞,并创建数据库配置和数据流连接资源。
准备工作
- 启用 Datastream、Network Connectivity 和 Compute Engine API。
- 确保您拥有创建和管理 Datastream 资源所需的 Identity and Access Management (IAM) 权限。如需了解详情,请参阅下文。
- 创建并配置用于复制的源 Cloud SQL for PostgreSQL 数据库。如需了解详情,请参阅为 CDC 配置 Cloud SQL for PostgreSQL 数据库。
建议您在创建数据流之前为实例启用逻辑复制。如果您未启用逻辑复制,Datastream 会为您启用,这会导致源实例重启。
如需了解如何为 Cloud SQL for PostgreSQL 实例启用逻辑复制,请参阅为 CDC 配置 Cloud SQL for PostgreSQL 数据库。
确保您的源数据库已配置为使用专用服务访问通道。
所需权限
如需使用自动数据流创建流程,您需要以下 Identity and Access Management (IAM) 角色或权限:
serviceusage.services.enable、compute.networkAdmin,用于启用必需的 API 和执行网络配置任务。cloudsql.admin用于实例配置任务。datastream.admin用于 Datastream 代表您执行的管理任务。
您的数据库管理员用户还需要对要复制的架构拥有 GRANT 权限。连接到源数据库并运行以下命令:
GRANT cloudsqlsuperuser TO "USER_NAME"; ALTER ROLE "USER_NAME" CREATEROLE; GRANT SELECT on ALL TABLES IN SCHEMA "SCHEMA_NAME" to"USER_NAME" WITH GRANT OPTION; ALTER DEFAULT PRIVILEGES IN SCHEMA "SCHEMA_NAME" GRANT SELECT ON TABLES TO "USER_NAME" WITH GRANT OPTION;
创建并启动数据流
如需创建并开始直播,请执行以下步骤:
控制台
开始使用
前往源 Cloud SQL for PostgreSQL 数据库实例概览页面。
在将数据流式传输到 BigQuery 中部分,点击创建数据流。
在开始使用页面上,在数据流名称字段中提供数据流的名称。系统会自动填充唯一标识符。
在提供实例用户账号详情部分中,选择身份验证方法:
IAM 数据库身份验证:如果您的用户已分配 Identity and Access Management (IAM) 主账号身份,则此选项可用。如需了解详情,请参阅 IAM 主账号。 如果您选择此选项,则必须手动向用户授予
cloudsqlsuperuser角色和CREATEROLE权限:- 在 Google Cloud 控制台中,前往 Cloud SQL 实例页面。
- 选择您的 Cloud SQL 实例。
- 在导航菜单中,点击 Cloud SQL Studio 并登录。
- 在探索器窗格中,针对您的用户运行以下查询:
GRANT cloudsqlsuperuser TO "USER_NAME"; ALTER ROLE "USER_NAME" CREATEROLE;
- 内置数据库身份验证:提供具有
cloudsqlsuperuser角色的用户的用户名和密码。如果您选择此选项,请确保用户对要复制的表拥有GRANT权限。
查看其他视频流详细信息,例如区域、加密和标签。 展开其他直播详情部分,根据需要应用更改。
点击继续。
配置来源
- 在配置流来源页面上,选择要从中复制数据的数据库。
- 默认情况下,要包含的对象列表会选择所有可用的对象。 列表中的对象是您拥有流式传输所需权限的对象。如需更改所选对象,请修改列表中的选择。
- 查看高级数据流配置,例如回填模式和并发回填连接数上限。展开高级视频流配置部分,以根据需要应用更改。
- 点击继续。
配置目标位置
- 在配置目的地页面上,根据需要调整 BigQuery 目的地设置。如需了解详情,请参阅配置有关数据流的目标位置的信息。
创建并启动数据流
点击创建并稍后启动可在 Datastream 中创建数据流并稍后启动,或点击启动可立即创建并启动数据流。
系统会自动执行任务,并向您发送通知:
- Datastream 会创建所需的虚拟私有云资源,例如内部 IP 地址范围、子网和网络连接。
- Datastream 会为表配置 CDC、设置复制槽、为数据库中的所有表设置发布内容,并创建专用 Datastream 用户。
- Datastream 会创建专用连接配置以及来源和目标连接配置文件。
确认您要创建或创建并启动数据流。
监控数据流
您可以在 Google Cloud 控制台的源实例概览页面中监控基本的数据流详细信息。该页面会显示信息,例如数据流状态、数据流名称、目标 BigQuery 数据集和目标项目标识符。
您还可以从概览页面执行操作,例如开始、停止或暂停直播。如需查看更精细的监控信息,请点击数据流名称以导航到 Datastream。
删除数据流
如果您删除使用自动化流程创建的数据流,系统会自动删除一些资源,例如 PostgreSQL 复制槽。不过,有些资源需要您手动删除:
- 出版物。发布是使用数据库管理员用户创建的,只能由其所有者(默认情况下是创建该发布的用户)删除。
- Datastream 读取者用户。
- Datastream 来源和目标连接配置文件
- 专用连接资源。
- 在自动化流程期间创建的所有网络资源,例如子网和网络连接。