本頁說明批次比較適用的雙重執行架構及其元件。
Dual Run 架構總覽
Dual Run 會部署在您自己的私人 Google Cloud 專案中,並以 Google Kubernetes Engine (GKE) 上的微服務集形式執行,與其他 Google Cloud 產品互動。
下圖顯示批次檔比較的雙重執行架構,詳情請參閱後續章節。

雙重執行架構,並在大型主機和 Google Cloud之間執行檔案比較作業。
Dual Run 元件
雙重執行包含下列元件:
- 檔案比較
- 設定管理員:使用者介面和資訊主頁
- 環境檢查工具
檔案比較
「檔案比較」是「雙重執行」元件,可讓您比較「雙重執行」設定的預期和實際檔案輸出內容。執行比較時,您可以設定容許程度,將結果標示為相等。
檔案比較功能會使用 Dataproc (在 Google Cloud上執行的全代管 Apache Spark 叢集) 執行比較作業。您可以透過兩種方式設定 Dataproc,具體取決於您打算比較的資料大小和基礎架構需求:
- 以無伺服器 Spark 為基礎的代管環境,在 Google Cloud Dataproc 上執行,並在 Dual Run 部署作業中建立。 這項工具採用固定設定,可讓您比較大小最多達數 GB 的檔案。
- 在 Dual Run 部署作業後建立及設定的 Dataproc Spark 叢集。這在下列情況中相當實用:
- 您打算使用特殊 VM 或磁碟設定。
- 您需要比較大於數 GB 的檔案。
- 您想同時執行多項比較作業。
設定管理工具
設定管理員是雙重執行的前端。 您可以使用 Google Cloud 身分與存取權管理,透過這個元件設定使用者存取權和權限。
設定管理員也提供資訊主頁環境,您可以在其中查看檔案比較工作的結果。您可以在資訊主頁中,根據套用的篩選條件查看比較結果摘要,並檢視每筆記錄的結果詳細資料。您也可以建立自訂報表和查詢。
環境檢查工具
環境檢查工具是 Dual Run 元件,可驗證 Dual Run 的安裝和部署是否順利完成。這項工具會檢查所有必要的雙重執行元件是否已正確設定及執行,並回報任何錯誤或設定錯誤。
Google Cloud 依附元件
Dual Run 內部依賴多項 Google Cloud 服務。系統會在雙重執行部署期間自動啟用及設定這些功能,您不必手動設定。
- Google Kubernetes Engine (GKE):Dual Run 會使用 GKE 在 Pod 中執行微服務。
- Cloud Storage:Dual Run 會使用 Storage bucket 儲存環境的設定檔,以及您要比較的構件。
- BigQuery:雙重執行會使用 BigQuery 儲存檔案比較輸出內容的結果。
- Pub/Sub:Dual Run 會使用 Pub/Sub 做為內部訊息系統,在不同 Pod 之間傳遞設定變更。
- Dataproc:雙重執行會使用 Dataproc 建立無伺服器 Spark 叢集,您可使用該叢集執行檔案比較作業。
- 工作流程和 Cloud Functions:Dual Run 會使用 Workflows 管理執行檔案比較作業的 Cloud Functions。
- Identity Platform:Dual Run 依賴 Identity Platform 做為驗證服務,提供身分與存取權管理功能。您可以使用 Google 或 SAML 識別資訊提供者,透過 Identity Platform 驗證使用者並授權角色。
- Cloud SQL:Dual Run 會建立 Cloud SQL 資料庫執行個體,確保與日後的更新相容。
後續步驟
進一步瞭解 Dual Run 檔案比較,這是負責比較主機和現代 Google Cloud 應用程式所產生資料的元件。