Vertex AI 特徵儲存庫 (舊版) 簡介

Vertex AI 特徵儲存庫 (舊版) 是可供整理、儲存和提供機器學習功能的集中存放區。組織可使用中央特徵儲存庫,大規模有效共用、探索及重複使用機器學習特徵,加快開發及部署新機器學習應用程式的速度。

Vertex AI 特徵儲存庫 (舊版) 是全代管解決方案,可管理及擴充儲存空間和運算資源等基礎架構。這項解決方案可讓資料科學家專注於特徵運算邏輯,不必擔心將特徵部署到正式環境時會遇到哪些挑戰。

Vertex AI 特徵儲存庫 (舊版) 是 Vertex AI 的整合式功能,您可以單獨使用 Vertex AI 特徵儲存庫 (舊版),也可以將其納入 Vertex AI 工作流程。舉例來說,您可以從 Vertex AI 特徵儲存庫 (舊版) 擷取資料,在 Vertex AI 中訓練自訂或 AutoML 模型。

Vertex AI 特徵儲存庫 (舊版) 是 Vertex AI 特徵儲存庫的前身。如要進一步瞭解 Vertex AI 特徵儲存庫,請參閱 Vertex AI 特徵儲存庫說明文件

總覽

使用 Vertex AI 特徵儲存庫 (舊版) 建立及管理特徵儲存庫實體類型特徵。特徵儲存庫是特徵及其值的頂層容器。設定特徵儲存庫後,獲准的使用者即可新增及分享特徵,不必尋求額外的工程支援。使用者可以定義特徵,然後從各種資料來源匯入 (擷取) 特徵值。進一步瞭解 Vertex AI 特徵儲存庫 (舊版) 資料模型和資源

任何獲得授權的使用者都能從特徵商店搜尋及擷取值。舉例來說,您可以找出特徵,然後進行批次匯出,取得用於建立機器學習模型的訓練資料。您也可以即時擷取特徵值,快速執行線上預測。

優點

使用 Vertex AI 特徵儲存庫 (舊版) 前,您可能已計算特徵值,並將這些值儲存在各種位置,例如 BigQuery 中的資料表,以及 Cloud Storage 中的檔案。此外,您可能還為儲存及使用特徵值建構並管理個別解決方案。相較之下,Vertex AI 特徵儲存庫 (舊版) 提供統一解決方案,可進行批次和線上儲存,以及提供機器學習特徵。以下各節將詳細說明 Vertex AI 特徵儲存庫 (舊版) 的優點。

在整個機構中分享功能

如果您在特徵商店中產生特徵,可以快速與他人分享,用於訓練或提供作業。團隊不必為不同專案或用途重新設計功能,此外,由於您可以從中央存放區管理及提供功能,因此能確保整個機構的一致性,並減少重複作業,尤其是高價值功能。

Vertex AI 特徵儲存庫 (舊版) 提供搜尋和篩選功能,方便其他人發掘及重複使用現有特徵。您可以查看各項功能的相關中繼資料,判斷功能的品質和使用模式。舉例來說,您可以查看特徵的有效值實體比例 (也稱為「特徵涵蓋範圍」),以及特徵值的統計分布。

代管解決方案,可大規模提供線上服務

Vertex AI 特徵儲存庫 (舊版) 提供線上特徵服務 (低延遲服務) 的代管解決方案,這對於及時進行線上預測至關重要。您不必建構及運作低延遲資料服務基礎架構,Vertex AI 特徵儲存庫 (舊版) 會為您完成這項作業,並視需要擴充。您負責編寫產生特徵的邏輯,但將提供特徵的作業卸載。所有這些管理作業都包含在內,可減少建構新功能時的摩擦,讓資料科學家專心工作,不必擔心部署問題。

降低訓練/應用偏差

當您在正式環境中使用的特徵資料分布,與用於訓練模型的特徵資料分布不同時,就會發生訓練/應用偏差。這種偏移通常會導致模型在訓練期間的效能,與實際工作環境中的效能有所差異。以下範例說明 Vertex AI 特徵儲存庫 (舊版) 如何解決訓練/服務偏差的潛在來源:

  • Vertex AI 特徵儲存庫 (舊版) 可確保特徵值只會匯入特徵儲存庫一次,且訓練和提供模型時都會重複使用相同值。如果沒有特徵商店,您可能會在訓練和服務之間,使用不同的程式碼路徑產生特徵。因此,訓練和提供模型時,特徵值可能有所不同。
  • Vertex AI 特徵儲存庫 (舊版) 提供時間點查詢功能,可擷取用於訓練的歷史資料。透過這些查詢,您就能只擷取預測前可用的特徵值,而非預測後的值,進而避免資料外洩。

如要進一步瞭解如何偵測訓練/服務偏差,請參閱「查看特徵值異常」。

偵測偏移

Vertex AI 特徵儲存庫 (舊版) 可協助您偵測特徵資料分布隨時間發生的重大變化,也就是所謂的漂移。Vertex AI 特徵儲存庫 (舊版) 會持續追蹤匯入特徵儲存庫的特徵值分布情形。特徵漂移增加時,您可能需要重新訓練使用受影響特徵的模型。如要進一步瞭解如何偵測漂移,請參閱「查看特徵值異常」。

配額與限制

Vertex AI 特徵儲存庫 (舊版) 會強制執行配額和限制,協助您設定用量限制來管理資源,並預防用量意外暴增的情況,進而保障 Google Cloud 使用者社群的權益。為避免遇到非預期的限制,請在「配額和限制」頁面查看 Vertex AI 特徵儲存庫 (舊版) 配額。舉例來說,Vertex AI 特徵儲存庫 (舊版) 會為線上服務節點數量設下配額,並為每分鐘可提出的線上服務要求數量設下配額。

資料保留

Vertex AI 特徵儲存庫 (舊版) 會保留特徵值,直到資料保留期限為止。這項限制是根據與特徵值相關聯的時間戳記,而非值匯入的時間。Vertex AI 特徵儲存庫 (舊版) 會排定刪除時間戳記超過上限的值。

定價

Vertex AI 特徵儲存庫 (舊版) 的價格取決於多項因素,例如您儲存的資料量,以及使用的特徵儲存庫線上節點數量。建立 featurestore 後,系統就會立即開始收費。詳情請參閱 Vertex AI 特徵儲存庫 (舊版) 定價

後續步驟