進行 A/B 實驗的一般指南

本頁面說明如何使用 A/B 實驗，瞭解 Vertex AI Search for commerce 對業務的影響。

總覽

A/B 實驗是一種隨機實驗，分為實驗組和控制組。實驗組會接受不同的處理方式 (在本例中，是 Vertex AI Search for Commerce 的預測或搜尋結果)，控制組則不會。

執行 A/B 實驗時，請在記錄使用者事件時，一併提供使用者所屬群組的資訊。這項資訊可用來修正模型並提供指標。

兩個版本的應用程式必須相同，但實驗組使用者會看到 Vertex AI Search for commerce 生成的結果，控制組則不會。您會記錄這兩組的使用者事件。

如要進一步瞭解流量分配，請參閱 App Engine 說明文件中的「分配流量」一文。

實驗平台

使用 VWO、AB Tasty 等第三方實驗平台設定實驗。控制組和實驗組都會從平台取得專屬的實驗 ID。記錄使用者事件時，請在 experimentIds 欄位中加入實驗 ID，指定使用者所屬的群組。提供實驗 ID 後，您就能比較控制組和實驗組看到的應用程式版本指標。

A/B 實驗最佳做法

A/B 實驗的目標是準確判斷更新網站 (在本例中為採用 Vertex AI Search for Commerce) 的影響。如要準確評估影響，您必須正確設計及執行實驗，避免其他差異影響實驗結果。

建議的實驗 ID 對應

實驗 ID 用於 A/B 測試，可比較 Vertex AI Search for Commerce 與現有的搜尋解決方案。此外，您也可以使用這些 API，在全面採用 Vertex AI Search for Commerce 的網站上執行實驗，例如針對控制組測試新的設定、控制項或提升規格。

使用者事件中的實驗 ID 欄位是陣列，可進行更精細的評估。

請見下列用途。

必須與對照組比較，才能評估 Vertex AI Search for commerce 的成效。
需要評估整體成效。
需要評估行動裝置專用廣告活動的成效。
需要評估僅限電腦的效能。
搜尋和建議的成效也需要分開評估。

如要取得如此精細的區隔評估結果，您可能需要 10 個實驗 ID，且每個事件的事件實驗 ID 陣列中都必須傳送四個 ID。

事件控制組的實驗 ID	測試 (搜尋商務) 事件群組的實驗 ID	使用者事件範圍
控管	Vertex AI Search for commerce	所有事件
`Control_mobile`	`Google_mobile`	所有行動裝置事件
`Control_desktop`	`Google_desktop`	所有電腦事件
`Control_search`	`Google_search`	所有搜尋和相關事件
`Control_recommendations`	`Google_recommendations`	所有建議和相關賽事

如要評估整體成效，請比較從事件中擷取的指標，並使用實驗 ID「Control」和「Vertex AI Search for commerce」。如要評估行動搜尋成效，請比較從事件衍生出的指標，其中實驗 ID 為 Control_mobile + Control_search 與 Google_mobile + Google_search。

類別階層

請確認控制組和實驗組的相同產品具有相同的類別階層。舉例來說，在控制組網站中，T 恤產品的類別階層為 clothing > mens > tops > tee-shirts，而測試組網站中，同一產品的類別階層為 mens > popular > tops。這項設定會導致控制組和測試網站的搜尋結果和類別商情項目不同。由於 page_category 是瀏覽呼叫的輸入內容，因此這個問題會影響瀏覽器體驗。

進行 A/B 測試前，確保使用者體驗一致

準備進行網站的 A/B 測試時，請務必注意電子商務網站與 Vertex AI Search 電子商務後端網站之間的使用者介面和體驗一致性，前者使用舊版搜尋後端做為控制項，後者則使用 Vertex AI Search 電子商務後端。請先準備好網站，再將實際使用者搜尋或推薦流量提供給 Vertex AI Search 電子商務套件，並正確對應實驗 ID。

假設有搜尋查詢，在控制搜尋後端和 Vertex AI Search for commerce 後端的搜尋結果頁面之間，要測試的項目包括：

顯示的構面數量是否相同？如果沒有，請在 Vertex AI Search for Commerce 中查看分面規格和屬性設定。這項功能非常重要，因為側欄可協助使用者從初始搜尋結果中篩選及瀏覽偏好的產品。更優質且更有意義的商情項目，可讓使用者更快找到偏好的產品。否則會導致更多點擊和捲動，可能妨礙搜尋體驗，最終影響轉換率和點閱率。這也可能導致使用者放棄搜尋。因此，如果控制組和測試組網站的切面相似，使用者在其中一個網站搜尋產品時，就不會比在另一個網站搜尋產品時享有不公平的優勢。

在搜尋結果中刊登贊助商產品，是許多電子商務網站的常見功能，且贊助商產品通常不屬於自然搜尋結果。請務必確保控制組網站和測試組網站的搜尋結果網頁中，顯示的產品和位置幾乎相同 (如果不是完全相同的話)。否則，收益成效指標的評估結果會受到雜訊影響，且視對照組和測試網站之間贊助產品的獨特性而定，雜訊可能偏高。

其他需要考量的使用者介面雜項：

控制組和測試組網站的價格和折扣資訊是否相同？
自動完成功能是否會針對搜尋查詢建議相同的完成內容？
各個層面值是否依相同順序排列？
列出的產品是否採用相同樣式，例如清單或格狀？

最後的提示和注意事項

如要設計有意義的 A/B 實驗，請注意下列事項：

設定 A/B 實驗前，請先使用預測或搜尋預覽功能，確保模型運作正常。
請確保實驗組和控制組的網站行為完全相同。

網站行為包括延遲時間、顯示格式、文字格式、網頁版面配置、圖片品質和圖片大小。控制組和實驗組的體驗在這些屬性方面應沒有明顯差異。
接受並顯示 Vertex AI Search for commerce 傳回的結果，且顯示順序與傳回順序相同。

可以篩除缺貨商品，不過，請避免根據業務規則篩選或排序結果。
如果您使用搜尋使用者事件，並在其中加入必要的歸因權杖，請確認設定正確無誤。請參閱「歸因權杖」說明文件。
請務必確認您在要求建議或搜尋結果時提供的供應設定，符合您對該建議或搜尋結果的意圖，以及顯示結果的位置。

使用建議時，服務設定會影響模型的訓練方式，進而影響推薦的產品。瞭解詳情。
如果比較現有解決方案與 Vertex AI Search for commerce，請務必將控制組的體驗與實驗組的體驗嚴格區隔。

如果控制解決方案未提供建議或搜尋結果，請勿在控制頁面中提供 Vertex AI Search for Commerce 的建議或搜尋結果。否則測試結果會出現偏差。

請確保使用者不會在控制組和實驗組之間切換。這在同一個工作階段內特別重要，但建議跨工作階段也這麼做。這樣可提升實驗成效，並協助您更快取得具統計顯著性的 A/B 測試結果。