提升數據分析效能

數據分析報表載入速度,以及對檢視者變更 (例如套用篩選器或變更日期範圍) 的回應速度,取決於多項因素,包括:

  • 基礎資料集的效能
  • 報表中視覺化項目查詢的資料量
  • 這些查詢的複雜程度
  • 網路延遲

其中有些因素是您 (或 Data Studio) 無法控制的。舉例來說,您可能無法改善基礎資料平台的反應速度或加快網路連線速度。不過,您可以採取一些措施,在數據分析中微調報表效能。

請注意,這裡提供的提示可能不適用於所有客戶的用途。

調整資料更新間隔

大多數資料來源類型都有資料更新頻率選項 (擷取的資料來源除外)。您可以透過這個選項,根據對最新資訊的需求,調整報表效能和潛在查詢費用或配額。每種資料來源類型都有預設的資料更新頻率門檻,但您可以視需要調整這個門檻。舉例來說,如果您要評估網站或應用程式的廣告成效,可能只需要每天更新資料。但如果是以社群媒體數據分析為依據的報表,可能就需要每天更新多次資料。

進一步瞭解如何管理資料更新間隔

使用擷取的資料來源

擷取的資料來源是最多 100 MB 資料的靜態快照。建立快照後,報表的資料要求會傳送至快照,而非基礎資料集。比起即時連結資料,使用擷取的資料來源可加快報表和探索的載入速度,讓您更快採取因應措施。

擷取的資料來源沒有資料更新間隔選項。您可以排定時間,讓系統更新擷取的資料來源。

進一步瞭解如何擷取資料

瞭解並行和資源調度

數據分析採用無伺服器架構,因此不會對同時查看報表的使用者人數設下硬性限制。效能和擴充性主要取決於報表連結的基礎資料來源容量和回應速度。

資料來源詳細資料

  • BigQuery: 使用 BigQuery 時,報表的並行和效能取決於 BigQuery 運算單元可用性、查詢複雜度、資料大小和快取等因素。監控 BigQuery 運算單元使用率和查詢效能。

    如要進行最佳化,請考慮採用 BigQuery 最佳做法,例如分區、分群及使用 BI Engine。

  • 其他資料來源: 如果是其他連接器 (例如 Google 試算表或第三方資料庫),並行限制會受到來源系統的 API 速率限制、資料庫連線集區和整體查詢處理能力的影響。

具體可行的建議

  • 最佳化資料來源查詢:確保查詢盡可能有效率。
  • 善用快取:使用 Data Studio 的資料更新間隔設定來快取資料,減少對來源的直接查詢。
  • 分階段推出:如果使用者人數眾多 (例如數千名使用者),請考慮分階段推出,同時監控對基礎資料來源的影響。
  • 監控基礎系統:檢查資料來源的效能和配額用量 (例如 BigQuery 運算單元或 API 配額)。

BigQuery 資料來源的改善項目

接下來的幾個小節將討論,如何提升使用 BigQuery 資料的報表效能。

使用 BI 引擎加速 BigQuery 資料來源

BigQuery BI Engine 是速度飛快的記憶體內分析服務,使用 BI Engine 分析儲存在 BigQuery 中的資料時,查詢回應時間不到一秒,並具備高度並行性。

BI Engine 與數據分析整合,可加快探索和分析資料的速度。您可以使用 BI Engine 在數據分析中建構豐富的互動式資訊主頁和報表,且不會影響效能、規模、安全性或資料更新間隔。

開始使用 BI Engine 搭配數據分析

對大型資料集執行複雜查詢時,請使用具體化資料表

如果 BigQuery 檢視區在執行階段執行複雜的計算或轉換,尤其是處理大型資料集時,將數據分析連結至該檢視區可能會很慢。雖然檢視畫面有助於重組資料,但如果執行即時計算 (例如為數百萬筆記錄動態產生已簽署的網址),可能會導致「數據分析」逾時。

請勿使用執行大量處理作業的檢視區塊,而是使用下列其中一個選項,將檢視區塊查詢的結果具體化為資料表:

接著,請將數據分析連結至 materialized view 或資料表,而非標準檢視區塊。這樣一來,數據分析就不必為每項要求重新執行複雜的計算。如要進一步提升具體化資料的效能,請使用 BI Engine

啟用 BigQuery Storage Read API

對於使用分頁結果的查詢,啟用 BigQuery Storage Read API 可縮短查詢時間。如果啟用後能縮短查詢執行時間,數據分析 就會自動使用 Storage Read API。

如要啟用 BigQuery Storage Read API,請將下列權限授予連結至 Google 數據分析的 BigQuery 使用者:

  • bigquery.readsessions.create
  • bigquery.readsessions.getData