設定 Microsoft OneDrive 資料儲存庫

本頁說明如何建立資料儲存庫,並將 Microsoft OneDrive 連結至 Gemini Enterprise。

事前準備

設定 Microsoft OneDrive 連線前,請先確認下列事項。

  1. 授予 Discovery Engine 編輯者角色 (roles/discoveryengine.editor)。使用者必須具備這個角色,才能建立資料儲存庫。如要授予這個角色,請按照下列步驟操作:

    1. 前往 Google Cloud 控制台的「IAM」頁面。

      前往「IAM」頁面

    2. 找出使用者帳戶,然後按一下「編輯」圖示。
    3. Discovery Engine Editor 角色授予使用者。詳情請參閱「IAM 角色和權限」。

  2. 在 Microsoft Entra ID 中,將 Gemini Enterprise 註冊為 OAuth 2.0 應用程式,並取得下列憑證

    • 用戶端 ID

    • 用戶端密鑰

    • 用戶群 ID

  3. 取得 Microsoft OneDrive 管理員同意後,設定 Microsoft API 應用程式權限

建立 Microsoft OneDrive 資料儲存庫

如要建立 Microsoft OneDrive 資料儲存庫,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Gemini Enterprise」頁面。

    Gemini Enterprise

  2. 選取或建立專案 Google Cloud 。

  3. 點按導覽選單中的「Data Stores」(資料儲存庫)

  4. 點按「 Create data store」(建立資料儲存庫)

  5. 在「來源」部分中,搜尋「Microsoft OneDrive」,然後按一下「選取」

  6. 在「資料」部分:

    1. 在「連接器模式」部分,選取「資料擷取」或「聯合搜尋」做為連線模式。
    2. 按一下「繼續」

    3. 在「驗證設定」部分,根據所選的連線模式設定驗證。

      1. 提供下列驗證詳細資料:

        • 用戶端 ID:在貴機構的 Microsoft Entra ID 中註冊的應用程式專屬 ID。
        • 用戶端密鑰:在 Microsoft Entra ID 中註冊 OAuth 2.0 應用程式時產生的密鑰。
        • 租戶 ID:Microsoft Entra 管理中心的貴機構專屬 ID。

        詳情請參閱「取得用戶端憑證」。

      2. 如果選取「聯合搜尋」,請按一下「登入」,然後完成 Microsoft 登入程序。

    4. 按一下「繼續」

    5. 如果選取「Federated Search」,請執行下列操作:

      1. 在「目的地」部分,輸入 Microsoft OneDrive 網站的基本網址。

      2. 在「進階選項」部分,輸入「Azure 租戶」,也就是建立 Entra 應用程式時取得的租戶 ID。

    6. 如果您選取「資料擷取」,請在「進階選項」部分執行下列操作:

      1. 選用:如要在系統中允許一組靜態 IP 位址,請選取「Enable static IP addresses」(啟用靜態 IP 位址) 核取方塊。
      2. 選用:在「Max QPS」(每秒查詢次數上限) 欄位中輸入每秒查詢次數上限,對連接器傳送至 Microsoft OneDrive 執行個體的查詢套用頻率限制。
      3. 選用:如要嘗試解密以 Microsoft Purview 資訊保護功能加密的所有檔案,請勾選「解密以 Microsoft Purview 資訊保護功能加密的檔案」核取方塊。
    7. 在「Entities to search」(要搜尋的實體) (如果您選取「聯合搜尋」) 或「Entities to sync」(要同步處理的實體) (如果您選取「資料擷取」) 部分:

      1. 選取所有必要實體。
      2. 如果選取「聯合搜尋」,請繼續下一個步驟。
      3. 如果您選取「資料擷取」,請繼續執行下列步驟:
        1. 選用:如要同步處理特定專案,請按照下列步驟操作:
          1. 按一下「Filter」(篩選)
          2. 如要從索引中篩除實體,請選取「Exclude from the index」(從索引中排除) 核取方塊,如要確保實體包含在索引中,請選取「Include to the index」(包含在索引中) 核取方塊。
          3. 輸入金鑰。每輸入一個,就按下 Enter 鍵。
          4. 按一下 [儲存]
        2. 如要設定同步時間表,請按照下列步驟操作:
          1. 在「同步頻率」清單中,選取同步頻率。
            • 如要分別排定實體和身分資料的完整同步作業,請展開「Full sync」(完整同步) 部分的選單,然後選取「Custom options」(自訂選項)
          2. 在「Incremental sync frequency」(增量同步頻率) 清單中,選取增量同步頻率。 詳情請參閱同步時間表
  7. 按一下「繼續」

  8. 在「動作」部分中:

    1. 如果選取「聯盟搜尋」
      1. 在「選取要啟用的 Microsoft OneDrive 動作」中,選取類別中的動作,為連接器啟用這些動作。
    2. 如果您選取「資料擷取」

      1. 在「驗證設定」部分,根據所選的連線模式設定驗證。 提供下列驗證詳細資料:

        • 用戶端 ID:在貴機構的 Microsoft Entra ID 中註冊的應用程式專屬 ID。
        • 用戶端密鑰:在 Microsoft Entra ID 中註冊 OAuth 2.0 應用程式時產生的密鑰。
        • 租戶 ID:Microsoft Entra 管理中心的貴機構專屬 ID。

        詳情請參閱「取得用戶端憑證」。

      2. 按一下「登入」並登入 Microsoft OneDrive,驗證您的帳戶。

      3. 按一下「繼續」

      4. 在「進階設定」部分,輸入「Azure 租戶」,也就是建立 Entra 應用程式時取得的租戶 ID。

      5. 在「目的地」部分,輸入 Microsoft OneDrive 網站的基本網址。

      6. 在「選取要啟用的 Microsoft OneDrive 動作」中,選取類別中的動作,為連接器啟用這些動作。

  9. 按一下「繼續」

  10. 在「設定」部分:

    1. 從「多區域」清單中,選取資料連接器的位置。
    2. 在「資料連接器名稱」欄位中,輸入連接器的名稱。
    3. 如果您選取 USEU 做為位置,請設定「加密設定」
      • 選用:如尚未設定單一區域金鑰,請按一下「前往設定頁面」。詳情請參閱「為第三方連接器註冊單一區域金鑰」。
      • 選取「Google管理的加密金鑰」或「Cloud KMS 金鑰」
      • 如果您選取「Cloud KMS 金鑰」
        • 在「金鑰管理類型」清單中,選取適當的類型。
        • 在「Cloud KMS key」(Cloud KMS 金鑰) 清單中,選取金鑰。
      詳情請參閱「客戶管理的加密金鑰」。

  11. 按一下「繼續」

  12. 在「帳單」部分,選取「一般定價」或「可設定的定價」。詳情請參閱「驗證專案的帳單狀態」和「授權」。

  13. 點按「Create」(建立)。Gemini Enterprise 會隨即建立資料儲存庫,並在「Data Stores」(資料儲存庫) 頁面上顯示。

在「資料儲存庫」頁面,點選資料儲存庫名稱即可查看狀態。資料儲存庫狀態從「建立中」變更為「運作中」後,即可使用 Microsoft OneDrive 連接器。

如果是使用 Microsoft OneDrive 建立的擷取連接器,資料儲存庫狀態會在啟動同步作業時,從「建立中」轉換為「執行中」。擷取完成後,狀態會變更為「Active」(運作中),表示資料儲存庫已完成設定。視資料量而定,擷取作業可能需要數小時。

建立資料儲存庫後,請建立應用程式將應用程式連結至 Microsoft OneDrive 資料儲存庫,並授權 Gemini Enterprise 存取 Microsoft OneDrive,然後再執行任何查詢。

啟用資料擷取的即時同步功能

按照下列步驟操作,為資料儲存庫啟用即時同步處理功能。

  1. 前往 Google Cloud 控制台的「Gemini Enterprise」頁面。

    Gemini Enterprise

  2. 點按導覽選單中的「Data Stores」(資料儲存庫)

  3. 點按要啟用即時同步功能的 Microsoft OneDrive 資料儲存庫名稱。

  4. 在資料儲存庫的「Data」(資料) 頁面中,等待「Connector state」(連接器狀態) 轉變為「Active」(運作中)

  5. 在「Real-time sync」(即時同步處理) 欄位中,點按「View/edit」(查看/編輯)

  6. 點按「Enable real-time sync」(啟用即時同步處理)切換鈕,開啟即時同步處理功能。

  7. 在「Client secret」(用戶端密鑰) 欄位中輸入值。這個值將用來驗證 Microsoft OneDrive Webhook 事件。建議使用長度為 20 個字元的字串。

  8. 點選「Save」(儲存)

    等待「Real-time sync」(即時同步處理) 欄位變更為「Running」(執行中)

資料處理和查詢執行

本節說明 Gemini Enterprise 如何管理查詢,以及使用聯邦資料儲存庫對隱私權的影響。

查詢執行

授權 Microsoft OneDrive 並將搜尋查詢傳送至 Gemini Enterprise 後:

  • Gemini Enterprise 會將搜尋查詢直接傳送至 Microsoft API。
  • Gemini Enterprise 會結合並顯示各個連結資料來源的結果,提供詳盡的搜尋結果。

資料處理

使用第三方聯合搜尋功能時,適用下列資料處理規則:

  • 查詢字串會傳送至第三方搜尋後端 (Microsoft API)。
  • 這些第三方可能會將查詢與您的身分建立關聯。
  • 如果啟用多個聯合搜尋資料來源,查詢可能會傳送至所有來源。
  • 一旦第三方系統收到資料,這些資料就受到該系統的《服務條款》和《隱私權政策》規範。

後續步驟