Looker 的 BigQuery 默认连接(Google Cloud 核心)

Looker (Google Cloud Core) 必须连接到数据库,才能进行数据探索。您可以使用 BigQuery 快速入门连接创建与 BigQuery 标准 SQL 数据库的默认连接。

首页上的 BigQuery 快速入门功能块。

准备工作

配置 BigQuery 快速入门连接需要以下权限。

Looker 权限

如果您拥有以下 Looker 权限之一,则可以在 Looker (Google Cloud Core) 实例的 首页 上查看和修改 BigQuery 快速入门连接 页面:

IAM 权限

在设置与 BigQuery 的连接时,Looker (Google Cloud Core) 实例可以使用 应用默认凭据 (ADC) 进行身份验证。使用 ADC 时,连接将使用 Looker (Google Cloud Core) 服务账号的凭据向数据库进行身份验证。该服务帐号必须具有以下 IAM 权限才能访问 BigQuery 数据集:

  • 对于包含 BigQuery 数据集的项目,Looker 服务帐号必须具有以下 IAM 角色:

  • 对于结算项目,Looker 服务帐号必须具有以下 IAM 角色:

如果 Looker (Google Cloud Core) 服务帐号尚未拥有必要的 IAM 角色,请在授予该项目中的角色时使用该服务帐号的电子邮件地址。如需查找服务帐号的电子邮件地址,请前往控制台中的 IAM 页面,然后选中 Google Cloud 包括 Google 提供的角色授予 复选框。电子邮件的格式为 service-<project number>@gcp-sa-looker.iam.gserviceaccount.com。使用该电子邮件向服务账号授予适当的角色

配置 BigQuery 快速入门连接

拥有正确权限的用户可以从首页管理 面板中的连接 页面查看和修改 BigQuery 快速入门连接。在连接 页面上,BigQuery 快速入门连接会显示在 Default BigQuery Connection 名称下。在新实例中,存储项目 ID结算项目 ID 字段将默认设置为

首页 上,点击查看连接 按钮即可管理连接。您可以点击 x 或切换探索 边栏中的 BigQuery 快速应用 选项,关闭首页 图块。

BigQuery 快速入门连接包含以下部分:

结算项目 ID

项目 ID 用作 Google Cloud 结算项目的唯一标识符。结算项目是因 BigQuery 使用情况而产生费用的 Google Cloud 项目,但如果 LookML 开发者在 LookML 视图探索联接sql_table_name 参数中指定了完整范围的表名称,您仍然可以查询不同 Google Cloud 项目中的数据集。这是一个必填字段。

如需使用 OAuth 向 BigQuery 数据库进行身份验证:对于 BigQuery 连接,Looker (Google Cloud Core) 可以自动使用 Looker (Google Cloud Core) 管理员在创建实例时使用的 OAuth 应用凭据。如需了解详情,请参阅为 Looker (Google Cloud Core) 实例创建 OAuth 客户端和凭据页面

展开状态详情 部分,以测试连接的设置。

主数据集

主数据集 页面包含以下设置。

存储项目 ID

存储项目 ID 字段中,输入包含您要连接的 BigQuery 数据集的项目的项目 ID,即使该项目与包含 Looker (Google Cloud Core) 实例的项目相同也是如此。这是一个必填字段。

主数据集

如果在 SQL 查询文本中未指定表的位置,则 BigQuery 将查找主数据集中的表。请注意,只要查询使用格式为 project_id.dataset_name.table_name 的全范围表名称,Looker (Google Cloud Core) 查询便可引用任何项目或数据集中的表。Looker (Google Cloud Core) 服务帐号还需要相应的 IAM 权限 才能访问该位置的表。这是一个必填字段。

如需详细了解数据集,请参阅将 Looker 连接到 BigQuery 文档页面。

展开状态详情 部分,以测试连接的设置。

为 BigQuery 连接配置可选设置

可选设置 部分包含以下选项:

  • 每个节点的连接数上限:同时允许的数据库连接数上限。注意:此项设置是以 Looker (Google Cloud Core) 部署中的每个节点为单位。该值必须介于 5 到 100 之间,并且最初可以保留默认值。如需详细了解此设置,请参阅每个节点的连接数上限部分的将 Looker 连接到数据库文档页面。

  • 连接池超时时间:在连接池已满的情况下,查询在超时之前等待的秒数。最初可以保留默认值。如需详细了解此设置,请参阅连接池超时部分的将 Looker 连接到数据库文档页面。

  • 其他 JDBC 参数:添加任何其他 JDBC 参数,例如 BigQuery 标签(如需了解详情,请参阅本页面的BigQuery 连接的作业标签和上下文注释部分)。

  • 维护时间表:Cron 表达式,用于指明数据组触发检查和 PDT 维护的最大频率。如需详细了解此设置,请参阅维护时间表文档。

  • SSL:选择是否要使用 SSL 加密来保护在 Looker (Google Cloud Core) 和数据库之间传输的数据。SSL 只是可用于保护数据的一种选项;如需了解其他安全选项,请参阅启用安全的数据库访问文档页面。

  • 验证 SSL:选择是否要要求验证连接使用的 SSL 证书。如需详细了解此设置,请参阅 验证 SSL 部分的 将 Looker 连接到数据库 文档页面。

  • 预缓存表和列:在 SQL Runner 中,选择连接和架构后,系统会立即预加载所有表信息。这样,您只需点击表名称,SQL Runner 即可快速显示表列。但是,对于包含许多表或包含非常大的表的连接和架构,您可能不希望 SQL Runner 预加载所有信息。

  • 提取和缓存架构:对于某些 SQL 编写功能(例如聚合感知),Looker (Google Cloud Core) 会使用数据库的信息架构来优化 SQL 编写。如需详细了解此设置,请参阅提取信息架构以进行 SQL 编写部分的将 Looker 连接到数据库文档页面。

  • 启用 PDT:开启启用 PDT 开关以启用永久性派生表。启用 PDT 后,可选设置 窗口会显示其他 PDT 字段和 PDT 覆盖 部分。

  • 临时数据库:在 BigQuery 中输入 Looker (Google Cloud Core) 将在其中创建永久性派生表的数据集。您应提前配置此数据集,并授予适当的写入权限。如需使用 PDT,必须填写此字段。

  • PDT 构建器连接数上限PDT 构建器连接数上限 设置默认为 1 ,但最高可设置为 100 。不过,该值不能高于每个节点的连接数上限 中设置的值。如需详细了解此设置,请参阅PDT 构建器连接数上限部分将 Looker 连接到数据库文档页面。请谨慎设置此值。如果该值过高,可能会使数据库不堪重负。如果该值较低,则长时间运行的 PDT 或聚合表可能会延迟其他永久性表的创建,或减慢连接上的其他查询速度。

  • 重试失败的 PDT 构建重试失败的 PDT 构建 开关用于配置 Looker (Google Cloud Core) 再生器 尝试重新构建在上一个再生器周期中失败的触发器持久化表的方式。如需详细了解此设置,请参阅 重试失败的 PDT 构建 部分的 将 Looker 连接到数据库 文档页面。

  • PDT API 控制PDT API 控制 开关用于确定是否可以将 start_pdt_buildcheck_pdt_buildstop_pdt_build API 调用用于此连接。如果停用 PDT API 控制 开关,当这些 API 调用引用此连接上的 PDT 时,将会失败。

  • PDT 覆盖:如果您的数据库支持永久性派生表,并且您已在连接设置中开启启用 PDT 开关,Looker (Google Cloud Core) 会显示 PDT 覆盖 部分。在 PDT 覆盖 部分中,您可以输入单独的专用于 PDT 进程的 JDBC 参数(主机、端口、数据库、用户名、密码、架构、其他参数和连接后语句)。如需详细了解此设置,请参阅 PDT 覆盖 部分的 将 Looker 连接到数据库 文档页面。

  • 数据库时区:数据库用于存储基于时间的信息的时区。Looker (Google Cloud Core) 需要知道这一点,以便为用户转换时间值,从而更轻松地理解和使用基于时间的数据。如需了解详情,请参阅使用时区设置文档页面。

  • 查询时区:只有在停用用户自选时区后,才会显示查询时区选项。如需了解详情,请参阅使用时区设置文档页面。

展开状态详情 部分,以测试连接的设置。

查看

查看 部分中,查看并修改您在前面部分中输入的连接详细信息。

展开状态详情 部分,以测试连接的设置。点击每个部分旁边的修改图标,即可返回到该部分以更改设置。

保存并测试连接

如需保存对 BigQuery 快速入门连接所做的任何更改,请点击保存

您可以在 Looker (Google Cloud Core) 界面中的以下几个位置测试连接设置:

  • 展开任何快速入门连接页面底部的状态详情 部分,然后点击测试连接
  • 首页 上,展开快速入门连接图块底部的状态详情 部分,然后点击测试连接
  • 连接 “管理”页面上,选择连接列表旁边的测试 按钮,如连接文档页面中所述。

输入连接设置后,点击测试 以验证信息是否正确,以及数据库是否能够连接。

如果连接未通过一项或多项测试,请尝试以下问题排查方法:

后续步骤