前提条件
本页介绍了部署 Cortex Framework Data Foundation 解决方案内容所需的前提条件。请先花些时间熟悉这些资源,然后再继续。
了解您的业务需求
考虑您的业务目标和要求,以及支持这些目标和要求所需的数据源。部署 Cortex Framework 内容时,您需要了解哪些数据源和工作负载是满足业务需求所必需的,并且与部署相关。
查看可用的工作负载和数据源
如需查看 Cortex Framework 支持的兼容工作负载和数据源,请参阅数据源和工作负载。熟悉您要处理的数据类型(例如,来自 Salesforce、SAP 或其他数据源的数据)。
复习基础知识
熟悉一些关键的 Google Cloud 服务和所需组件:
- Google Cloud 控制台
- Cloud Shell
- Cloud Shell Editor
- BigQuery
- Cloud Build
- Identity and Access Management
- Cloud Composer
- Apache Airflow
- Dataflow
- Workflows
- Colab Enterprise
了解变更数据捕获 (CDC),以便跟踪数据更新。如需了解详情,请参阅 CDC 指南。
探索代码库
本页中列出的前提条件专门针对从官方 GitHub 代码库部署 Cortex Framework Data Foundation 内容而设计。此代码库包含用于部署 Cortex Framework 的必要资源,包括配置文件、实体关系图 (ERD) 和预定义的数据模型。
选择或创建项目
部署 Cortex Framework Data Foundation 解决方案内容涉及以下项目:
- 源项目:原始数据所在的项目。您至少需要一个Google Cloud 项目来存储数据并运行部署流程。
- 目标项目(可选):Cortex Framework Data Foundation 存储其处理后的数据模型的项目。此项目可以与源项目相同,也可以根据您的需求而有所不同。
如果您希望为每个工作负载分别设置项目和数据集(例如,为 SAP 设置一组源项目和目标项目,为 Salesforce 设置另一组目标项目和源项目),请为每个工作负载分别运行部署。如需了解详情,请参阅可选步骤部分中的使用不同的项目来隔离访问权限。
如需选择或创建项目,请执行以下操作:
-
在 Google Cloud 控制台中,前往项目选择器页面。
-
选择或创建 Google Cloud 项目。
选择或创建项目所需的角色
- 选择项目:选择项目不需要特定的 IAM 角色,您可以选择已获授角色的任何项目。
-
创建项目:如需创建项目,您需要拥有 Project Creator 角色 (
roles/resourcemanager.projectCreator),该角色包含resourcemanager.projects.create权限。了解如何授予角色。
获取所需的角色
如需获得部署 Cortex Framework Data Foundation 解决方案内容所需的权限,请让管理员向您授予源项目和目标项目的以下 IAM 角色:
-
BigQuery Job User (
roles/bigquery.jobUser) -
BigQuery Data Editor (
roles/bigquery.dataEditor) -
创建服务账号 (
roles/iam.serviceAccountCreator) -
Project IAM Admin (
roles/resourcemanager.projectIamAdmin) -
Project Reader (
roles/reader) -
Service Usage Admin (
roles/serviceusage.serviceUsageAdmin) -
Storage Object Viewer (
roles/storage.objectViewer) -
Storage Admin (
roles/storage.admin) -
Cloud Build Editor (
roles/cloudbuild.builds.editor)
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
后续步骤
查看完这些前提条件后,您就可以开始部署了: