使用資料產品

本文適用於 Knowledge Catalog (原稱 Dataplex Universal Catalog) 資料產品消費者,他們想探索及使用資料產品來解決用例。

如要進一步瞭解資料產品的架構和重要概念,請參閱「關於資料產品」。

事前準備

  1. 啟用 Dataplex 和 BigQuery API。

    啟用 API 時所需的角色

    如要啟用 API,您需要服務使用情形管理員 IAM 角色 (roles/serviceusage.serviceUsageAdmin),其中包含 serviceusage.services.enable 權限。瞭解如何授予角色

    啟用 API

必要的角色

如要取得搜尋、存取及使用資料產品所需的權限,請要求系統管理員在資料產品或專案中,授予您下列 IAM 角色:

如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。

您或許也能透過自訂角色或其他預先定義的角色,取得必要權限。

資料產品消費者必須具備 viewer 權限,才能在來源系統中存取相應資產,進而查看資產的中繼資料。舉例來說,如要搜尋資料產品中的資料集或資料表的中繼資料,您需要 BigQuery 中繼資料檢視者角色 (roles/bigquery.metadataViewer)。詳情請參閱存取搜尋結果的必要角色

控制台

  1. 在 Google Cloud 控制台,前往 Knowledge Catalog 的「Search」(搜尋) 頁面。

    前往「Search」(搜尋) 頁面

  2. 使用關鍵字或自然語言搜尋。詳情請參閱「搜尋資源」。

  3. 在搜尋結果中,按一下要查看詳細資料的資料產品。您可以查看與資料產品相關的說明、資產、合約、層面、聯絡資訊和其他文件。

REST

如要搜尋資料產品,請使用 searchEntries 方法。

舉例來說,請傳送下列 POST 要求:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d \
  '{
  "query": "ADDITIONAL_KEYWORDS (type=(DATA_PRODUCT))",
  "pageSize": 10
  }' \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/global:searchEntries"

更改下列內容:

  • ADDITIONAL_KEYWORDS (選用):任何其他關鍵字或搜尋條件,可縮小結果範圍 (例如 displayName:'My Data Product'description:'sales')
  • PROJECT_ID:建立資料產品的 Google Cloud專案 ID

要求存取資料產品

資料產品消費者如果沒有存取資料產品的 IAM 權限,可以使用整合式存取核准工作流程要求存取權。

提交存取要求

控制台

  1. 前往 Google Cloud 控制台的 Knowledge Catalog「資料產品」頁面。

    前往「資料產品」

  2. 按一下要存取的資料產品。

  3. 按一下 [要求存取權]。

  4. 在「要求詳細資料」窗格中,指定下列參數:

    • 存取權群組:選取要加入的功能存取權群組。
    • 「使用者」或「服務帳戶」:選取主體類型:

      • 如要為自己要求存取權,請選取「本人」

      • 如要為程式輔助身分要求存取權,請選取「服務帳戶」。只有在資料產品支援服務帳戶時,才能使用這個選項。

    • 理由:輸入要求存取權的正當業務理由。

  5. 按一下「提交」

系統會產生新的變更要求,供資料產品擁有者審查。 要求獲得核准或拒絕後,您會收到電子郵件通知,瞭解最終狀態。

REST

擁有 dataplex.dataProducts.get 權限的資料產品消費者可以建立 ChangeRequest 資源,要求存取權。使用自訂方法 :requestAccess,將 POST 要求傳送至資料產品資源端點:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d '{
  "parent": "projects/PROJECT_ID/locations/LOCATION/dataProducts/DATA_PRODUCT_ID",
  "change_request": {
    "justification": "JUSTIFICATION_TEXT",
    "data_product_access_request": {
      "parent": "projects/PROJECT_ID/locations/LOCATION/dataProducts/DATA_PRODUCT_ID",
      "access_group_id": "DATA_PRODUCT_ACCESS_GROUP_ID"
    }
  }
}' \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataProducts/DATA_PRODUCT_ID:requestAccess"

更改下列內容:

  • PROJECT_ID:您 Google Cloud 專案的 ID

  • LOCATION:資料產品所在的區域 (例如 us-central1)

  • DATA_PRODUCT_ID:目標資料產品的專屬 ID

  • JUSTIFICATION_TEXT:說明為何需要存取權的業務原因

  • DATA_PRODUCT_ACCESS_GROUP_ID:您要求加入的特定存取權群組 ID

查看存取權要求狀態

資料產品消費者可以監控已提交存取要求的進度和生命週期。Knowledge Catalog 會追蹤並顯示這些要求,並根據您查看的是統一工作流程清單還是特定產品的存取權摘要,使用不同的狀態。

查看存取權要求統整清單

如要查看所有資料產品中您提交的所有存取要求完整清單,請按照下列步驟操作:

控制台

  1. 前往 Google Cloud 控制台的 Knowledge Catalog「Governance workflows」(控管工作流程) 頁面。

    前往「治理工作流程」

  2. 按一下「我的要求」分頁標籤。

  3. 查看整合式清單,其中會顯示您過去和待處理的要求,以及目前的工作流程狀態:

    • :存取權要求已建立,正在等待核准者審查。

    • 已核准:要求已獲准,但後端系統仍在佈建存取權。

    • 已遭拒:要求遭到拒絕,查看核准者的註解,瞭解拒絕原因。

REST

使用自訂集合方法 :listMine 傳送 GET 要求:

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/changeRequests:listMine"

查看特定資料產品的存取摘要

除了全域工作流程清單,您也可以查看個別資料產品的存取權狀態。這樣一來,您就能確認自己是否已擁有素材資源群組的繼承存取權,不必再提交新的要求。

如要查看資料產品的存取摘要,請按照下列步驟操作:

控制台

  1. 前往 Google Cloud 控制台的 Knowledge Catalog「資料產品」頁面。

    前往「資料產品」

  2. 按一下要檢查的特定資料產品。

  3. 按一下「存取摘要」分頁標籤。查看該資料產品所有存取群組的狀態。

    「存取摘要」分頁使用下列狀態:

    狀態 說明
    沒有任何存取權限 您沒有存取權群組的存取權,且尚未要求存取權。
    審核中 您已提交存取要求,目前正在等待核准者審查。
    已核准 您的存取權要求已獲准,但系統仍在處理成員資格的傳播作業,將您新增至基礎 Google 群組。
    已授予存取權 存取權已完全啟用。您是存取權群組的成員,可以與資料產品的資產互動。
    已遭拒 您對這個存取權群組提出的要求已遭拒。

REST

使用原始建立要求時傳回的專屬 ID,傳送 GET 要求:

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/changeRequests/CHANGE_REQUEST_ID"

更改下列內容:

  • PROJECT_ID:您 Google Cloud 專案的 ID

  • LOCATION:資料產品所在的區域 (例如 us-central1)

  • CHANGE_REQUEST_ID:您提交的變更要求的專屬 ID

刪除存取要求

  1. 前往 Google Cloud 控制台的 Knowledge Catalog「Governance workflows」(控管工作流程) 頁面。

    前往「治理工作流程」

  2. 按一下「我的要求」分頁標籤。

  3. 找到包含目標資料產品要求的資料列。如有必要,請套用篩選條件,找出所需項目。

  4. 按一下 「動作」,然後按一下「刪除」

使用資料產品

如要使用資料產品,請確認您已獲得必要權限。 請參閱「要求資料產品存取權」。

資料產品擁有者授予權限後,您就能存取資料產品及其資產。舉例來說,如果您獲准存取 BigQuery 資料表,就能直接在 BigQuery 中查詢資料表,進而產生洞察資料。

使用使用者憑證存取資產

如果您的使用者憑證存取要求已獲准,請按照下列步驟存取資產:

  1. 搜尋資料產品
  2. 在搜尋結果中,按一下要使用的資料產品。
  3. 按一下「資產」分頁標籤。
  4. 按一下要查看詳細資料的資產。系統隨即會開啟項目詳細資料頁面。

    您可以存取結構定義、洞察和沿襲等詳細資料。 如果資產是 BigQuery 資料表或檢視區塊,您可以點選「在 BigQuery 中開啟」,前往 BigQuery Studio 並查詢結果。

使用服務帳戶存取資產

如果服務帳戶的存取要求獲得核准,您會取得資料產生者服務帳戶的服務帳戶權杖建立者 (roles/iam.serviceAccountTokenCreator) IAM 角色。這樣您就能建立模擬鏈,存取基礎資產。

如要使用服務帳戶存取資產,請按照下列步驟操作:

  1. 前往資料產品詳細資料頁面的「資料資產」分頁,找出資料產品已設定的服務帳戶。

  2. 如要模擬資料產生者服務帳戶,請使用下列 Google Cloud CLI 指令,為服務帳戶建立模擬鏈結:

    gcloud config set auth/impersonate_service_account CONSUMER_SERVICE_ACCOUNT,PRODUCER_SERVICE_ACCOUNT
    

    更改下列內容:

    • CONSUMER_SERVICE_ACCOUNT:資料產品消費者所屬服務帳戶的完整電子郵件地址

    • PRODUCER_SERVICE_ACCOUNT:對應至資料產品存取權群組的服務帳戶完整電子郵件地址

    詳情請參閱「使用服務帳戶模擬功能」。

使用遠端 MCP 伺服器存取資料產品

如要讓用戶端應用程式和開發工具與 Google Cloud 生態系統外的資料產品互動,可以使用遠端 Model Context Protocol (MCP) 伺服器。這個架構模式可讓外部開發人員用戶端安全地查詢及探索已編目的資料資產,同時維持統一的控管界線。

如要瞭解如何部署及連線至外部伺服器,請參閱「使用 Knowledge Catalog 遠端 MCP 伺服器」。

後續步驟