使用資料沿襲功能來降低成本

在這個情境中,您管理一個 BigQuery 專案,其中包含衍生自就業與薪資季報 (QCEW) 的資料集。專案包含多個表格和檢視畫面,可用於各種資訊主頁和分析,例如追蹤就業趨勢或比較薪資。因此儲存空間費用會增加。為降低成本,您可以找出未積極用做 BigQuery 中作業或資產來源的資料表或檢視表,並將其列為刪除候選項目。

使用資料沿襲功能,找出未做為任何其他 BigQuery 工作來源的資產。檢查每個資產的下游連結,有系統地標記未使用的資源以供刪除,藉此降低儲存空間費用。

開始使用

如要完成這個用途,請先設定環境並執行資料轉換。請參閱先決條件和設定頁面,瞭解如何將遠端存放區連結至 Dataform。這個存放區包含設定資料集和轉換資料所需的程式碼。

完成環境設定後,請使用 BigQuery 和沿襲關係圖瀏覽器,以視覺化方式找出沒有下游依附元件的資產。

使用歷程探索工具找出未使用的資產

準備好資料集後,找出缺少下游依附元件的資產。您可以針對個別資料表以視覺化方式執行這項操作,也可以對較大的資料集使用程式輔助方法。

在本例中,請比較有效素材資源與獨立素材資源,判斷哪些素材資源可以安全移除:

  1. 前往 Google Cloud 控制台的「BigQuery」BigQuery頁面。
  2. 使用搜尋欄位找出獨立資料表 (例如特定年份的舊分析資料表)。
  3. 按一下「歷程」分頁標籤。
  4. 在「沿革探索工具」窗格中,執行下列操作:
    1. 在「方向」部分,選取「下游」方向。
    2. 按一下「套用」

觀察圖表。如果沒有下游節點,表示該資產未做為其他追蹤 BigQuery 工作的來源。如要進一步瞭解如何使用資料歷程圖表呈現資料,請參閱「歷程圖表檢視畫面」。