資料品質

本頁面說明搜尋功能的使用情境、各情境的成效等級,以及如何在 Gemini Enterprise for Customer Experience 控制台中查看 AI Commerce Search,評估資料品質並瞭解已解鎖的成效等級。只要符合所有升級限制資料規定,系統就會自動啟用各個成效等級。如要升級至下一個級別,你還必須符合所有前一級別的條件。

搜尋用途

搜尋功能會提供兩種用途的搜尋結果:

  • 文字查詢搜尋:購物者在應用程式中輸入文字查詢,即可搜尋商品並取得一組相關結果。
  • 瀏覽搜尋:購物者進入特定類別頁面時使用,例如居家修繕商店零售網站的「家電」類別網頁,並瀏覽該類別中經過排序的項目。

如要進一步瞭解這兩種用途的差異,請參閱「關於文字搜尋和瀏覽搜尋」。

解鎖搜尋成效等級

文字查詢搜尋和瀏覽搜尋有不同的效能等級,可逐步改善搜尋結果。如要解鎖成效等級,必須將使用者事件和目錄資料上傳至 AI Commerce Search。

文字查詢搜尋和瀏覽這兩種用途都有下列成效層級:

第 1 層

關聯性

系統會根據與查詢的關聯程度傳回結果,例如查詢黑色洋裝時,黑色洋裝的黑度。

最低資料門檻

  • 目錄
  • 文字查詢

資料檢查

  • 產品應附上說明。
  • 至少 95% 的搜尋要求應啟用查詢擴充功能。
  • detail-page-view 事件與搜尋事件的比例應至少為 4%。
  • 產品應有獨一無二的標題,方便使用者在搜尋查詢中辨識。
  • 產品名稱應至少包含 2 個字。
  • 至少 95% 的產品應有標題。
  • 產品應具備有效且可存取的 URI。
  • 目錄中應至少有 5 個可供搜尋的自訂屬性。
  • 所有產品的完全比對欄位都不得包含任何實字,且只能有一個權杖。

第 2 層

關聯性與熱門度

  • 針對查詢搜尋中最熱門的項目,調整第 1 層。
  • 系統會根據產品在網站上的熱門程度,對相關性相同的產品進行排序。

資料檢查

升級封鎖功能,解鎖第 2 層

  • 過去 90 天內,至少須匯入或記錄 10 萬個文字搜尋和瀏覽事件。

著重效能

  • 過去 90 天內,至少有 95% 的事件應與產品連結。
  • 過去 7 天內,至少有 1.5% 的搜尋事件包含後續網頁,也就是包含所有相關聯的搜尋結果網頁和產品曝光。
  • 過去 7 天內,至少 95% 的搜尋事件應與產品曝光相關聯。
  • 過去 90 天內,至少有 10,000 個 detail-page-viewadd-to-cartpurchase 事件。
  • 過去 90 天內,至少要有 70% 的搜尋要求有相關聯的事件。
  • 過去 90 天內,至少有 95% 的搜尋事件含有歸因權杖。
  • 過去 7 天內,與最熱門訪客 ID 相關聯的事件至少有 10 萬個。

第 3 級

全力提升收益

如要啟用收益最佳化功能,請對超過 25 萬個搜尋事件建立模型,且至少要有一個使用者互動。

資料檢查

解除封鎖,升級至第 3 層

  • 如要正常進行收益最佳化,95% 的產品必須有價格。這需要主要產品或至少一個子類別有價格。產品缺貨中時,請為產品提供 out-of-stock 屬性,而非清除價格。

  • 過去 90 天內,至少要有 25 萬個搜尋事件與使用者互動相關聯 (後續須有 detail-page-viewadd-to-cartpurchase 事件,且訪客 ID 相同,並包含搜尋事件中的其中一項產品)。

  • 至少要有 25 萬個搜尋使用者事件,且這些事件必須有緊接在搜尋事件後發生的 detail-page-view 事件,才能達到門檻。如果過去 30 天內上傳的事件超過 1 億筆,系統就會計算這項指標。否則時間範圍為 90 天。

  • 至少要有 100 項產品,至少發生過一次可歸因於搜尋事件的detail-page-view事件。如果過去 30 天內上傳的事件超過 1 億筆,系統會根據過去 30 天的資料計算這項指標。否則時間範圍為 90 天。

著重效能

  • 搜尋事件應與查詢 (文字) 或類別頁面 (瀏覽) 建立關聯。不應有兩者皆為空白的搜尋事件。理想情況下,您應該有大量搜尋事件,且兩個欄位都已填寫。

  • 搜尋要求不得包含空白查詢。理想情況下,與搜尋事件類似,搜尋要求應填入查詢 (文字) 和網頁類別 (瀏覽)。這項指標的計算方式為最近 60 天內所有搜尋要求的百分比。

  • 如要達到這個門檻,每 1,000 個 detail-page-view 事件中,至少要有 20 個是過去 90 天內的 add-to-cart 事件。

  • 每 1,000 個 add-to-cart 事件中,至少要有 25 個 purchase 事件來自過去 90 天。

第 4 級

個人化收益

第 4 級別以第 3 級別為基礎,新增個人化功能。

資料檢查

升級封鎖功能,解鎖第 4 級

  • 過去 30 天內,AI 智慧商務搜尋 (而非舊版引擎) 必須放送至少 10 萬個 search 事件。

  • 請勿快取個人化搜尋結果。如果多個搜尋使用者事件具有不同的訪客 ID,但歸因權杖相同,系統就會偵測到快取。這項指標是根據最近 10 萬筆含有 Vertex AI 權杖的搜尋事件計算得出。

  • 系統必須在各個事件和搜尋要求中,追蹤一致的 visitorId (以及登入使用者的 userId)。在最近 10 萬個使用者事件中,SearchRequests 與使用者事件的訪客 ID 媒合率必須超過 10%。

著重效能

  • 為提升個人化品質,搜尋 API 要求和搜尋事件之間,至少應有 10% 的訪客 ID 相符。

  • 至少 1% 的搜尋事件應已設定使用者 ID。

  • 至少 1% 的搜尋要求應已設定使用者 ID。

瀏覽

銅級

隨機結果的基準瀏覽

  • 符合篩選條件的任何搜尋結果,順序隨機。

最低資料門檻

  • 目錄
  • 類別頁面 (瀏覽) 查詢

銀級

熱門程度

  • 系統只會根據與類別的關聯性傳回結果。

資料檢查

升級封鎖功能,即可解鎖銀級

  • 必須匯入或記錄過去 90 天內至少 10 萬個文字搜尋或瀏覽事件。

著重效能

  • 產品應具備有效且可存取的 URI。(建議:> 95.0%)

  • 至少 95% 的產品應有標題。(建議:> 95.0%)

  • 產品名稱應至少包含 2 個字。(建議:> 80.0%)

  • 產品應附上說明。(建議:> 90.0%)

  • 產品應有獨一無二的標題,方便使用者在搜尋查詢中辨識。(建議:< 50.0%)

  • 至少 90% 的瀏覽要求應設定篩選器和 page_category。這項指標是根據過去 60 天的資料計算而得。(建議:> 90.0%)

  • 匯入或記錄過去 90 天內的更多 detail-page-viewadd-to-cartpurchase 事件。(建議:> 10000)

  • 如果瀏覽要求時只看到極少結果,可能是因為篩選條件過於嚴格。這項指標是根據過去 60 天的資料計算而得。(建議:< 10.0%)

  • 如果瀏覽要求包含過多產品,可能表示要求篩選條件缺少類別限制。這項指標是根據過去 60 天的資料計算而得。(建議:< 10.0%)

  • 匯入或記錄過去 90 天內的更多 details-page-view 事件。(建議:> 0.04)

黃金

收益最佳化排名

這個層級會根據收益目標,盡可能提高瀏覽類別中的產品排名。

資料檢查

升級封鎖功能即可解鎖黃金等級

  • 搜尋的產品中,至少有 95% 必須提供有效價格資訊。必須為主要產品或至少一個子類定價。產品缺貨時,請勿清除價格。

  • 過去 90 天內,至少有 25 萬個瀏覽搜尋使用者事件,且後續發生 detail-page-viewadd-to-cartpurchase 事件,這些事件具有相同訪客 ID,且包含搜尋事件中的其中一項產品。

  • 過去 90 天內,至少有 25 萬個在瀏覽事件後立即發生的detail-page-view事件 (匯入或記錄)。

  • 過去 90 天內,至少要匯入或記錄 100 個不同產品的 detail-page-view 事件。

著重效能

  • 至少 95% 的瀏覽要求和事件應具有完全相符的篩選器值。這項指標是根據過去 60 天的資料計算而得。(建議:> 95.0%)

  • 至少 95% 的瀏覽要求和事件應具有完全相符的 page_category 值。這項指標是根據過去 60 天的資料計算而得。(建議:> 95.0%)

  • 至少 95% 的瀏覽事件應有歸因符記。這項指標是根據過去 90 天的資料計算而得。(建議:> 95.0%)

  • 至少 70% 的瀏覽要求應有相關聯的使用者事件。這項指標是根據過去 60 天的資料計算而得。(建議:> 70.0%)

  • 搜尋事件的查詢和網頁類別不得同時為空。(建議:< 5.0%)

  • 搜尋事件不應同時填入查詢和網頁類別。(建議:< 10.0%)

  • 瀏覽要求應填入網頁類別。如果瀏覽要求沒有網頁類別,我們就不知道使用者位於哪個網頁,因此無法盡量提高收益。這項指標是根據過去 60 天的資料計算而得。(建議:< 5.0%)

  • 搜尋要求應填入查詢或網頁類別,但不得同時填入兩者。這項指標是根據過去 60 天的資料計算而得。(建議:< 10.0%)

  • 每 1,000 個 add-to-cart 事件中,過去 90 天內至少要有 25 個 purchase 事件。(建議值:> 0.02)

  • 每 1,000 個 detail-page-view 事件中,過去 90 天內至少應有 20 個 add-to-cart 事件。(建議:> 0.025)

白金

個人化收益最佳化排名

這個層級會根據個別使用者的行為和偏好,在瀏覽類別中提供個人化產品排名,盡可能提高收益。

資料檢查

升級封鎖功能即可解鎖白金級

  • 過去 90 天內,至少要有 10 萬個 AI Commerce Search 瀏覽使用者事件含有 Vertex AI 歸因權杖。確保所有瀏覽曝光都記錄為事件,並包含歸因符記。

  • Vertex AI 提供的瀏覽結果中,至少有 99.0% 不得為快取結果。個人化搜尋結果不應快取。如果多個瀏覽使用者事件具有不同的訪客 ID,但歸因權杖相同,系統就會偵測到快取。這是根據最近 10 萬個含有 Vertex AI 權杖的瀏覽事件計算得出。

  • 瀏覽 API 要求和相應的瀏覽使用者事件之間,至少要有 10.0% 的訪客 ID 相符。這是根據 Vertex AI 提供的最近 10 萬個瀏覽事件計算得出。

著重效能

  • 匯入或記錄更多含有使用者 ID 的使用者事件,提升個人化品質。這項指標是根據過去 7 天的資料計算而得。(建議:> 1.0%)

  • 為提升個人化品質,搜尋要求中的使用者 ID 值應與對應搜尋事件中的使用者 ID 相符。這項指標是根據過去 60 天的資料計算而得。(建議:> 10.0%)

在 Gemini Enterprise for Customer Experience 控制台的 AI Commerce Search 中,系統會提供頁面,方便你查看是否符合各層級的資料規定。

接下來的章節將說明如何註冊資料品質快訊,根據目前的參數,系統會通知您資料屬於哪個層級。這些快訊也會做為指南,說明特定用途的資料規定,協助你盡可能提升搜尋結果。

檢查資料品質

上傳資料後,前往 Gemini Enterprise for Customer Experience 控制台的 AI Commerce Search,即可查看資料,並檢查各個成效層級的指標,瞭解您的用途。

  1. 前往 Gemini Enterprise for Customer Experience 控制台的 AI Commerce Search「資料品質」頁面。

    前往「資料品質」頁面

  2. 查看搜尋用途的資料檢查指標:

    • 如要查看文字搜尋指標,請按一下「搜尋」分頁標籤。
    • 如要查看瀏覽搜尋指標,請按一下「瀏覽」分頁標籤。
  3. 在頁面頂端查看每個成效等級的問題評分卡。

    • 如果標示為「使用中」:你已解決該層級的所有封鎖問題,並已解鎖。
    • 如果阻礙性問題數量為 0:您已通過該層級的資料檢查。如果這個級別和所有先前級別都沒有任何會妨礙升級的問題,系統大約需要 24 小時訓練及準備模型,並啟用新解鎖的級別。
    • 如有任何阻礙性問題:請檢查層級的指標,瞭解要解決哪些資料問題,才能解鎖該層級。
  4. 查看各個效能級別的資料檢查指標表格,瞭解可能妨礙升級或影響搜尋成效的問題。

  5. 查看「狀態」欄,瞭解各項資料檢查指標的優先順序:

    • 升級阻礙:找出導致搜尋功能無法將使用案例升級至下一個效能級別的資料問題。如要解鎖某個級別,請先完成該效能級別和先前級別所有會妨礙升級的資料問題檢查作業。
    • 效能重大問題:找出不會阻擾升級,但會對文字搜尋或瀏覽搜尋效能造成重大影響的資料問題。
    • 符合規定:表示這項資料檢查已通過。
    • 無法使用:表示尚未完成非升級阻礙資料檢查。這些指標的值會顯示為「不適用」。匯入資料後,部分資料檢查最多可能需要 24 小時才會開始計算。
  6. 如要進一步瞭解任何指標,請按一下「詳細資料」,查看顯示該指標說明、資料檢查時間戳記和門檻值的詳細資料面板。

  7. 在指標的「詳細資料」面板中查看門檻值,瞭解需要哪些值才能通過該指標的資料檢查,進而提升成效。並非所有指標都適用所有門檻:

    • 封鎖門檻:滿足這項指標資料檢查的必要門檻。
    • 重大閾值:強烈建議達到此閾值。 如果未達到這個門檻,成效可能會大幅下滑。
    • 警告門檻:建議達到的門檻。未達到這個門檻可能會對成效造成輕微影響。

如要匯入更多資料來解決資料問題,請參閱公開說明文件中的「匯入歷來的使用者事件」或「匯入目錄資訊」。

最佳做法

  • 在搜尋要求和使用者事件中,除了訪客 ID 之外,也請提供已登入使用者的使用者 ID。這樣一來,搜尋功能就能根據使用者在各裝置上的登入事件,為使用者提供個人化搜尋結果。
  • 即時傳送使用者事件,而非延遲分批上傳。這有助於搜尋功能根據使用者在您網站上的最新活動,提供個人化體驗。
  • 上傳所有使用者事件。舉例來說,請勿只提交可歸因於搜尋的事件。

收益最佳化高階層級的功能選取

如果零售商的資料達到較高的成效層級,即可使用升級版 AI 商業搜尋功能,發揮收益最佳化搜尋功能的潛力。這些頂級零售商現在可以選用功能:

  • 瀏覽:銀級和黃金級
  • 搜尋:第 3 和第 4 層

為什麼要升級排名?

大型 AI Commerce Search 客戶的產品目錄最多可有 10,000 個自訂屬性,而先前的排名模型只有 20 個靜態產品特徵 (例如價格和平均評分),且所有客戶共用這些特徵。這導致排名模型擁有的產品資料非常不完整,也無法針對不同零售領域和用途 (例如時裝、硬體或居家用品) 自訂產品功能。

由於無法建立自訂屬性模型,部分使用者會將他們認為重要的屬性放入靜態 (固定) 產品功能。但這需要手動操作,而且顯然只適用於少數屬性。

動態自訂特徵選取

AI 商業搜尋已升級收益最佳化層級,可自動選取自訂屬性。升級時,系統會將相關的自訂屬性納入排名程序:

  • 檢查每個零售商的所有自訂屬性,並選擇最實用的屬性,加入靜態產品功能集。
  • 顯示各零售商的所選屬性。
  • 定期重複執行特徵選取程序 (每 30 天一次)。

總而言之,AI 商業搜尋不僅提供排名模型多達 100 倍以上的新功能供模型選用,還會定期更新每位顧客的屬性,以配合季節性銷售和其他動態資料變化。

升級後的排名解決方案會定期更新自訂屬性,藉此提升資料品質,提供更強大的搜尋洞察。

完整的產品知識

  • 功能選取:AI 商業搜尋演算法會為每個零售商選取最多 20 個最重要的自訂屬性。
  • 優點:運用產品的額外資訊 (例如特價代碼和產品/樣式規格),提升排名準確度。
  • 曝光度:零售商可以查看所選自訂屬性,確保屬性維持最新狀態。
  • 自訂和學習:顧客可以找出所選自訂屬性的模式,並新增其他相關屬性,進一步提升排名成效。

如何查看目前使用的屬性

如果客戶啟用較高層級的方案,並提供足夠的使用者事件資料點,現在就能在 Gemini Enterprise for Customer Experience 的 AI Commerce Search 中,於「資料品質」頁面的「文字搜尋」和/或「瀏覽搜尋」分頁標籤下方,查看新的自訂屬性資訊。這裡會顯示 AI 商家搜尋系統選擇的自訂屬性。

替代文字

自訂屬性的用途

  • 請維護所選屬性,不要刪除或停用,以免影響模型。
  • 改善自動選取屬性的涵蓋範圍,為更多產品填入這些欄位
  • 查看系統自動選取自訂屬性的趨勢。如果還有其他類似屬性,請將其加入目錄。這些功能會成為候選項目,供功能搜尋演算法選取。
  • 請為數值屬性指派數值,而非字串值,以正確註解數值屬性。舉例來說,請提供數值 10.5,而非文字 (「10.5」)。

關閉個人化設定

如要關閉個人化設定,請將 ServingConfig.personalizationSpec 設為 mode.DISABLED

資料品質快訊

如果資訊主頁上的指標值從「符合」變更為「不符合」,系統就會觸發資料品質快訊。系統會透過電子郵件傳送快訊。

如要查看 Cloud Monitoring 相關快訊,請參閱「設定快訊」。

查看資料品質

  1. 前往 Gemini Enterprise for Customer Experience 控制台的 AI Commerce Search「資料品質」頁面。

    前往「資料品質」頁面

  2. 查看資料列、指標和快訊:一個資料列對應一個指標,一個指標對應一個快訊。

設定資料品質快訊

REST

呼叫 UpdateAlertConfig API。

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" -H "X-GFE-SSL: yes" -H "X-Goog-User-Project: PROJECT_ID" \
 "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/alertConfig" \
--data '
{
  "alertPolicies": [
    {
      "alertGroup": "search-data-quality",
      "enrollStatus": "ENROLLED",
      "recipients": [
        {
          "emailAddress": "EMAIL_ADDRESS_1"
        },
        {
          "emailAddress": "EMAIL_ADDRESS_2"
        }
      ]
    }
  ]
}'

更改下列內容:

  • PROJECT_ID: Google Cloud 專案的 ID。
  • EMAIL_ADDRESS_1EMAIL_ADDRESS_2:要註冊接收快訊的電子郵件地址。必須符合 SMTP 標準。一項快訊政策最多可新增 20 個電子郵件地址。

控制台

  1. 前往 Gemini Enterprise for Customer Experience 控制台的 AI Commerce Search「資料品質」頁面。

    前往「資料品質」頁面

  2. 按一下頂端的「設定快訊」

  3. 新增至少一個電子郵件地址。電子郵件地址應符合 SMTP (簡易郵件傳輸通訊協定) 規定。一個快訊政策最多可新增 20 個電子郵件地址。

  4. 點選「提交」

停用資料品質警告

REST

呼叫 UpdateAlertConfig API。

curl -X PATCH -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" -H "X-GFE-SSL: yes" -H "X-Goog-User-Project: PROJECT_ID" \
 "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/alertConfig" \
--data '
{
  "alertPolicies": [
    {
      "alertGroup": "search-data-quality",
      "enrollStatus": "DECLINED",
      "recipients": [
      ]
    }
  ]
}'

更改下列內容:

  • PROJECT_ID: Google Cloud 專案的 ID。

控制台

  1. 前往 Gemini Enterprise for Customer Experience 控制台的 AI Commerce Search「資料品質」頁面。

    前往「資料品質」頁面

  2. 按一下 「設定快訊」

  3. 刪除所有現有電子郵件。

  4. 點選「提交」

疑難排解

以下說明如何解決常見問題。

資料檢查未通過

如果資料檢查未通過,請在「資料品質」頁面按一下該指標的「詳細資料」,查看該指標的詳細說明和通過資料檢查的門檻。

如果已符合資料要求,請查看「時間戳記」部分,瞭解該指標上次的計算時間。如果您最近重新格式化或擷取大量資料,系統可能需要數小時才能重新計算該指標。

如果資料不符合規定,您可能需要重新格式化資料或收集更多資料,才能通過資料檢查。確認資料符合指標門檻後,請重新匯入格式化資料或匯入其他資料,然後等待系統重新計算指標。

標示為「不適用」的指標值

如果沒有上傳任何資料,或是指標尚未計算,指標值會顯示為「不適用」。匯入資料後,部分資料檢查最多可能需要 24 小時才會開始計算。

效能層級沒有阻礙性問題,但未啟用

如要排解問題,請按照下列步驟操作:

  1. 檢查先前級別是否有任何會妨礙升級的資料問題。如要升級至下一個級別,您必須符合所有先前級別的條件。

  2. 等待 24 小時。通過所有會妨礙升級的資料檢查後,系統會訓練及準備模型,並啟用新解鎖的級別,這大約需要 24 小時。

如果通過所有升級阻礙資料檢查後,效能層級在兩天內未標示為使用中,請聯絡 AI Commerce Search 支援團隊,並提供專案編號和專案 ID,以尋求協助。

其他資料規定資訊

如要進一步瞭解 AI Commerce Search 資料規定,請參閱下列說明文件:

後續步驟