總覽
Google Cloud Cortex Framework 提供資料產品加速器,可將策略性企業系統的原始資料,轉換為可信賴的高品質資料資產,以供進階數據分析和 AI 使用。
Google Cloud Cortex Framework 以可自訂的開放原始碼形式提供,可在您自己的Google Cloud 環境中安全部署,並提供以 BigQuery 原生執行的無伺服器模型,由Google Cloud Dataform 提供技術支援。
Cortex Framework 可簡化團隊建構、協調及部署資料管道的方式,加速創造價值,並為新一代企業 AI 代理提供高保真度的基礎。
資料架構
Cortex Framework 會使用「擷取、載入及轉換」(ELT) 方法,將 BigQuery 內的資料處理作業標準化為三個不同的架構層。這項標準化資料分層策略符合企業資料網格概念。
來源系統
來源系統是擷取資料的來源。來源系統可包含各種企業應用程式、資料庫或平台,從中擷取資料。如要查看所有支援的來源系統,請參閱「支援的來源系統」。
原始圖層
原始層代表 BigQuery 中不可變動的登陸區資料集,用於存放來源資料,包括變更資料擷取 (CDC) 記錄或批次擷取資料。雖然 BigQuery 經常儲存 CDC 記錄 (例如,使用 BigQuery Connector for SAP 或 BigQuery Toolkit for SAP 等複製工具,從 SAP ECC 或 S/4HANA 取得),但其設計目的是代表任何原始格式。對於未提供 CDC 記錄的來源 (例如 Salesforce 或外部 API 饋給),這個層級會完整擷取批次資料或原始事件酬載,並盡量不進行結構變更。這個層級會提供資料基礎層。
資料基礎層
資料基礎層是來源資料最新記錄的標準化乾淨呈現方式,並會提供給資料產品層。對於啟用 CDC 的來源,這個層會以遞增方式更新,對於未啟用 CDC 的來源和外部實作的 CDC 來源,則會使用檢視畫面。實作方式會配合來源系統的功能。詳情請參閱「資料基礎」。
資料產品層
資料產品層提供匯總、KPI 計算、商業邏輯和跨應用程式連線邏輯。資料產品層公開的檢視區塊和資料表,可供 BigQuery 對話式數據分析代理、Gemini Enterprise、機器學習模型、商業智慧資訊主頁和報表,以及應用程式整合功能直接使用。詳情請參閱「資料產品」。
資料管理
Cortex Framework 使用 Dataform 管理資料生命週期。Dataform 可讓您管理資料整合的資料轉換作業。這項服務可讓資料分析師在 BigQuery 中開發、測試、版本管控,並安排資料轉換複雜的工作流程。為動態配合自訂項目和擴充功能,Cortex Framework 會在建構階段建立 Dataform 程式碼,並將程式碼暫存至 Google Cloud中的 Dataform 存放區。
在 Dataform UI 中觸發管道執行作業後,系統會建立資料基礎和資料產品層的 BigQuery 資料表和檢視區塊,並填入資料。
後續步驟
準備好建構及部署了嗎?請參閱下列指南,瞭解如何設定及執行環境: