特徵供應
本文說明如何提供特徵,供 BigQuery ML 模型訓練和推論使用。無論選擇哪個選項,您都必須先將特徵儲存至 BigQuery 資料表。
時間點正確性
用來訓練模型的資料通常內建時間依附元件。為時間敏感特徵建立特徵表時,請加入時間戳記資料欄,代表每個資料列在特定時間的特徵值。然後,在查詢這些特徵資料表中的資料時,您可以使用時間點查詢函式,確保訓練和服務之間不會發生資料外洩。這項程序可確保時間點正確性。
如要擷取時間敏感型特徵,請使用下列函式指定時間點截斷:
在 BigQuery ML 中提供特徵
如要在 BigQuery ML 中訓練模型及執行批次推論,您可以使用時間點正確性一節所述的時間點查詢函式,擷取特徵。您可以在 CREATE MODEL 陳述式的 query_statement 子句中納入這些函式,用於訓練,也可以在適當的資料表值函式 (例如 ML.PREDICT) 的 query_statement 子句中納入這些函式,用於放送。
使用 Vertex AI 特徵儲存庫提供特徵
如要將特徵提供給在 Gemini Enterprise Agent Platform 中註冊的 BigQuery ML 模型,可以使用 Vertex AI 特徵儲存庫。Vertex AI 特徵儲存庫會以 BigQuery 中的特徵表為基礎,管理及提供低延遲特徵。您可以透過線上提供即時擷取特徵,用於線上預測;也可以透過離線服務擷取特徵,用於模型訓練。
如要進一步瞭解如何準備 BigQuery 特徵資料,以便在 Vertex AI 特徵儲存庫 中使用,請參閱「準備資料來源」。