将 Shopify 数据加载到 BigQuery 中

您可以使用适用于 Shopify 的 BigQuery Data Transfer Service 连接器将数据从 Shopify 加载到 BigQuery。借助 BigQuery Data Transfer Service,您可以安排周期性转移作业,以将 Shopify 中的最新数据添加到 BigQuery。

Shopify 连接器支持从以下资源转移基于 GraphQL 的资源(例如 CollectionsOrders)的数据:

  • 基于订阅的账号
  • 合作伙伴账号

限制

Shopify 数据转移作业受到以下限制:

  • 若要在数据转移作业中包含 GiftCards 对象,与此数据转移作业关联的账号必须拥有 ShopifyPlus 订阅。
  • 若要在数据传输中包含以下应用订阅数据对象,Shopify 商店中安装的应用必须是销售渠道应用
    • AppSubscriptionLineItems
    • AppSubscriptions
    • ProductResourceFeedbacks
  • 若要纳入需要折扣函数的以下 Shopify 数据对象,您必须使用 Shopify CLI 创建 Shopify 应用。
    • DiscountsCodeApp
    • DiscountsCodeBasic

准备工作

以下部分介绍了在创建 Shopify 数据转移作业之前需要满足的前提条件。

Shopify 前提条件

  • 您必须拥有 Shopify 账号和 Shopify 商店。
  • 您必须为 Shopify 商店创建自定义 Shopify 应用。如需了解详情,请参阅自定义应用
  • 您必须拥有所有必需的访问权限范围。如需查看所有必需的访问权限范围,请参阅需身份验证的访问权限范围

BigQuery 前提条件

所需 BigQuery 角色

如需获得创建 BigQuery Data Transfer Service 数据转移作业所需的权限,请让您的管理员为您授予项目的 BigQuery Admin (roles/bigquery.admin) IAM 角色。 如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

此预定义角色可提供创建 BigQuery Data Transfer Service 数据转移作业所需的权限。如需查看所需的确切权限,请展开所需权限部分:

所需权限

创建 BigQuery Data Transfer Service 数据转移作业需要以下权限:

  • BigQuery Data Transfer Service 权限:
    • bigquery.transfers.update
    • bigquery.transfers.get
  • BigQuery 权限:
    • bigquery.datasets.get
    • bigquery.datasets.getIamPolicy
    • bigquery.datasets.update
    • bigquery.datasets.setIamPolicy
    • bigquery.jobs.create

您也可以使用自定义角色或其他预定义角色来获取这些权限。

如需了解详情,请参阅授予 bigquery.admin 访问权限

如果您想要为 Pub/Sub 设置转移作业运行通知,请确保拥有 pubsub.topics.setIamPolicy Identity and Access Management (IAM) 权限。如果您只是要设置电子邮件通知,则无需 Pub/Sub 权限。如需了解详情,请参阅 BigQuery Data Transfer Service 运行通知

设置 Shopify 数据转移作业

通过使用以下选项之一设置转移配置,将 Shopify 数据添加到 BigQuery 中:

控制台

  1. 前往 Google Cloud 控制台中的“数据转移”页面。

    转到“数据传输”

  2. 点击 创建转移作业

  3. 来源类型部分的来源中,选择 Shopify

  4. 数据源详细信息部分,执行以下操作:

    • 对于商店名称,请输入您的 Shopify 商店的名称。 例如,如果您的商家账号 ID 为 storename.myshopify.com,则您的商店名称为 storename
    • 对于客户端 ID客户端密钥,请输入 Shopify 应用的客户端 ID 和密钥。如需了解详情,请参阅关于客户端密钥
    • 对于要转移的 Shopify 对象,请点击浏览
      • 选择要转移到 BigQuery 目标数据集的任何对象。此外,您还可以在此字段中手动输入要包含在数据转移作业中的任何对象。
  5. 目标设置部分的数据集中,选择您创建用来存储数据的数据集。

  6. 转移配置名称部分的显示名称中,输入数据转移作业的名称。

  7. 时间表选项部分中,执行以下操作:

    • 重复频率列表中,选择一个选项来指定此数据转移作业的运行频率。如需指定自定义重复频率,请选择自定义。如果您选择按需,则当您手动触发转移作业时,此转移作业会运行。
    • 如果适用,请选择立即开始从设置的时间开始,并提供开始日期和运行时间。
  8. 可选:在通知选项部分中,执行以下操作:

    • 如需启用电子邮件通知,请点击电子邮件通知切换开关。启用此选项后,转移作业管理员会在转移作业运行失败时收到电子邮件通知。
    • 如需为此转移作业启用 Pub/Sub 转移作业运行通知,请点击 Pub/Sub 通知切换开关。您可以选择主题名称,也可以点击创建主题来创建一个主题。
  9. 点击保存

bq

输入 bq mk 命令并提供转移作业创建标志 --transfer_config

bq mk
    --transfer_config
    --project_id=PROJECT_ID
    --data_source=DATA_SOURCE
    --display_name=NAME
    --target_dataset=DATASET
    --params='PARAMETERS'

其中:

  • PROJECT_ID(可选):您的 Google Cloud 项目 ID。如果未提供 --project_id 来指定具体项目,则系统会使用默认项目。
  • DATA_SOURCE:数据源,shopify
  • NAME:数据转移作业配置的显示名称。转移作业名称可以是任何可让您在需要修改转移作业时识别该转移作业的名称。
  • DATASET:转移作业配置的目标数据集。
  • PARAMETERS:所创建转移作业配置的参数(采用 JSON 格式)。例如 --params='{"param":"param_value"}'。以下是 Shopify 数据转移作业的参数:

    • assets:要转移到 BigQuery 的 Shopify 对象的路径。
    • connector.shopName:您的 Shopify 商店的名称。例如,如果您的商家账号 ID 为 storename.myshopify.com,则您的商店名称为 storename
    • connector.authentication.accessToken:Shopify Admin API 访问令牌。

以下命令会在默认项目中创建增量 Shopify 数据转移作业。

bq mk
    --transfer_config
    --target_dataset=mydataset
    --data_source=shopify
    --display_name='My Transfer'
    --params='{"assets": ["Orders"]
        "connector.shopName": "storename",
        "connector.authentication.accessToken":"sk_test_123456789"}'
保存转移配置后,Shopify 连接器会根据您的安排选项自动触发转移运行。在每次转移运行时,Shopify 连接器都会将 Shopify 中的所有可用数据转移到 BigQuery。

如需在常规安排之外手动运行数据转移,您可以启动回填运行

支持的表

Shopify 连接器支持以下数据对象:

  • AppFeedbacks
  • AppSubscriptionLineItems(需要销售渠道应用
  • AppSubscriptions(需要销售渠道应用
  • Catalogs
  • Collections
  • Companies
  • CompanyContactRoleAssignments
  • CompanyContacts
  • CompanyLocations
  • Customers
  • DeliveryProfiles
  • DiscountsAutomaticApp(需要折扣函数
  • DiscountsAutomaticBasic(需要折扣函数
  • DiscountsAutomaticBxgy
  • DiscountsCodeApp
  • DiscountsCodeBasic
  • DiscountsCodeBxgy
  • DraftOrders
  • Files
  • FulfillmentEvents
  • FulfillmentOrders
  • Fulfillments
  • FulfillmentServices
  • FulfillmentTrackingInfo
  • GiftCards(需要订阅 ShopifyPlus
  • InventoryItems
  • Locations
  • Metafield 对象,例如 metafield_productmetafield_order
  • OrderRiskAssessments
  • Orders
  • OrderTransactions
  • PriceLists
  • ProductMediaImages
  • ProductOptions
  • ProductOptionValues
  • ProductResourceFeedbacks(需要销售渠道应用
  • Products
  • ProductVariants
  • Publications
  • Refunds
  • Returns
  • ScriptTags
  • Segments
  • SellingPlanGroups
  • StorefrontAccessTokens
  • UrlRedirects

数据类型映射

下表将 Shopify 数据类型映射到相应的 BigQuery 数据类型:

Shopify 数据类型 BigQuery 数据类型
String STRING
Int INT64
Decimal NUMERIC
Double FLOAT64
Long BIGNUMERIC
Bool BOOL
Datetime TIMESTAMP

价格

将 Shopify 数据转移到 BigQuery 的功能处于预览版阶段时,您无需付费即可使用此功能。

排查转移作业设置问题

如果您在设置数据转移作业时遇到问题,请参阅 Shopify 转移作业问题

后续步骤

  • 如需大致了解 BigQuery Data Transfer Service,请参阅什么是 BigQuery Data Transfer Service
  • 如需了解如何使用转移作业,包括获取有关转移作业配置的信息、列出转移作业配置以及查看转移作业的运行历史记录,请参阅管理转移作业