本頁說明如何建立資料儲存庫,並將 Microsoft OneDrive 連結至 Gemini Enterprise。
事前準備
設定 Microsoft OneDrive 連線前,請先確認下列事項。
授予 Discovery Engine 編輯者角色 (roles/discoveryengine.editor)。使用者必須具備這個角色,才能建立資料儲存庫。如要授予這個角色,請按照下列步驟操作:
在 Microsoft Entra ID 中,將 Gemini Enterprise 註冊為 OAuth 2.0 應用程式,並取得下列憑證:
用戶端 ID
用戶端密鑰
用戶群 ID
取得 Microsoft OneDrive 管理員同意後,設定 Microsoft API 應用程式權限。
建立 Microsoft OneDrive 資料儲存庫
如要建立 Microsoft OneDrive 資料儲存庫,請按照下列步驟操作:
前往 Google Cloud 控制台的「Gemini Enterprise」頁面。
選取或建立專案 Google Cloud 。
點按導覽選單中的「Data Stores」(資料儲存庫)。
點按「 Create data store」(建立資料儲存庫)。
在「來源」部分中,搜尋「Microsoft OneDrive」,然後按一下「選取」。
在「資料」部分:
- 在「連接器模式」部分,選取「資料擷取」或「聯合搜尋」做為連線模式。
按一下「繼續」。
在「驗證設定」部分,根據所選的連線模式設定驗證。
提供下列驗證詳細資料:
- 用戶端 ID:在貴機構的 Microsoft Entra ID 中註冊的應用程式專屬 ID。
- 用戶端密鑰:在 Microsoft Entra ID 中註冊 OAuth 2.0 應用程式時產生的密鑰。
- 租戶 ID:Microsoft Entra 管理中心的貴機構專屬 ID。
詳情請參閱「取得用戶端憑證」。
如果選取「聯合搜尋」,請按一下「登入」,然後完成 Microsoft 登入程序。
按一下「繼續」。
如果選取「Federated Search」,請執行下列操作:
在「目的地」部分,輸入 Microsoft OneDrive 網站的基本網址。
在「進階選項」部分,輸入「Azure 租戶」,也就是建立 Entra 應用程式時取得的租戶 ID。
如果您選取「資料擷取」,請在「進階選項」部分執行下列操作:
- 選用:如要在系統中允許一組靜態 IP 位址,請選取「Enable static IP addresses」(啟用靜態 IP 位址) 核取方塊。
- 選用:在「Max QPS」(每秒查詢次數上限) 欄位中輸入每秒查詢次數上限,對連接器傳送至 Microsoft OneDrive 執行個體的查詢套用頻率限制。
- 選用:如要嘗試解密以 Microsoft Purview 資訊保護功能加密的所有檔案,請勾選「解密以 Microsoft Purview 資訊保護功能加密的檔案」核取方塊。
在「Entities to search」(要搜尋的實體) (如果您選取「聯合搜尋」) 或「Entities to sync」(要同步處理的實體) (如果您選取「資料擷取」) 部分:
- 選取所有必要實體。
- 如果選取「聯合搜尋」,請繼續下一個步驟。
- 如果您選取「資料擷取」,請繼續執行下列步驟:
- 選用:如要同步處理特定專案,請按照下列步驟操作:
- 按一下「Filter」(篩選)。
- 如要從索引中篩除實體,請選取「Exclude from the index」(從索引中排除) 核取方塊,如要確保實體包含在索引中,請選取「Include to the index」(包含在索引中) 核取方塊。
- 輸入金鑰。每輸入一個,就按下 Enter 鍵。
- 按一下 [儲存]。
- 如要設定同步時間表,請按照下列步驟操作:
- 在「同步頻率」清單中,選取同步頻率。
- 如要分別排定實體和身分資料的完整同步作業,請展開「Full sync」(完整同步) 部分的選單,然後選取「Custom options」(自訂選項)。
- 在「Incremental sync frequency」(增量同步頻率) 清單中,選取增量同步頻率。 詳情請參閱同步時間表。
- 在「同步頻率」清單中,選取同步頻率。
- 選用:如要同步處理特定專案,請按照下列步驟操作:
按一下「繼續」。
在「動作」部分中:
- 如果選取「聯盟搜尋」:
- 在「選取要啟用的 Microsoft OneDrive 動作」中,選取類別中的動作,為連接器啟用這些動作。
如果您選取「資料擷取」:
在「驗證設定」部分,根據所選的連線模式設定驗證。 提供下列驗證詳細資料:
- 用戶端 ID:在貴機構的 Microsoft Entra ID 中註冊的應用程式專屬 ID。
- 用戶端密鑰:在 Microsoft Entra ID 中註冊 OAuth 2.0 應用程式時產生的密鑰。
- 租戶 ID:Microsoft Entra 管理中心的貴機構專屬 ID。
詳情請參閱「取得用戶端憑證」。
按一下「登入」並登入 Microsoft OneDrive,驗證您的帳戶。
按一下「繼續」。
在「進階設定」部分,輸入「Azure 租戶」,也就是建立 Entra 應用程式時取得的租戶 ID。
在「目的地」部分,輸入 Microsoft OneDrive 網站的基本網址。
在「選取要啟用的 Microsoft OneDrive 動作」中,選取類別中的動作,為連接器啟用這些動作。
- 如果選取「聯盟搜尋」:
按一下「繼續」。
在「設定」部分:
- 從「多區域」清單中,選取資料連接器的位置。
- 在「資料連接器名稱」欄位中,輸入連接器的名稱。
- 如果您選取
US或EU做為位置,請設定「加密設定」:- 選用:如尚未設定單一區域金鑰,請按一下「前往設定頁面」。詳情請參閱「為第三方連接器註冊單一區域金鑰」。
- 選取「Google管理的加密金鑰」或「Cloud KMS 金鑰」。
- 如果您選取「Cloud KMS 金鑰」:
- 在「金鑰管理類型」清單中,選取適當的類型。
- 在「Cloud KMS key」(Cloud KMS 金鑰) 清單中,選取金鑰。
按一下「繼續」。
點按「Create」(建立)。Gemini Enterprise 會隨即建立資料儲存庫,並在「Data Stores」(資料儲存庫) 頁面上顯示。
在「資料儲存庫」頁面,點選資料儲存庫名稱即可查看狀態。資料儲存庫狀態從「建立中」變更為「運作中」後,即可使用 Microsoft OneDrive 連接器。
如果是使用 Microsoft OneDrive 建立的擷取連接器,資料儲存庫狀態會在啟動同步作業時,從「建立中」轉換為「執行中」。擷取完成後,狀態會變更為「Active」(運作中),表示資料儲存庫已完成設定。視資料量而定,擷取作業可能需要數小時。
建立資料儲存庫後,請建立應用程式、將應用程式連結至 Microsoft OneDrive 資料儲存庫,並授權 Gemini Enterprise 存取 Microsoft OneDrive,然後再執行任何查詢。
啟用資料擷取的即時同步功能
按照下列步驟操作,為資料儲存庫啟用即時同步處理功能。
前往 Google Cloud 控制台的「Gemini Enterprise」頁面。
點按導覽選單中的「Data Stores」(資料儲存庫)。
點按要啟用即時同步功能的 Microsoft OneDrive 資料儲存庫名稱。
在資料儲存庫的「Data」(資料) 頁面中,等待「Connector state」(連接器狀態) 轉變為「Active」(運作中)。
在「Real-time sync」(即時同步處理) 欄位中,點按「View/edit」(查看/編輯)。
點按「Enable real-time sync」(啟用即時同步處理)切換鈕,開啟即時同步處理功能。
在「Client secret」(用戶端密鑰) 欄位中輸入值。這個值將用來驗證 Microsoft OneDrive Webhook 事件。建議使用長度為 20 個字元的字串。
點選「Save」(儲存)。
等待「Real-time sync」(即時同步處理) 欄位變更為「Running」(執行中)。
資料處理和查詢執行
本節說明 Gemini Enterprise 如何管理查詢,以及使用聯邦資料儲存庫對隱私權的影響。
查詢執行
授權 Microsoft OneDrive 並將搜尋查詢傳送至 Gemini Enterprise 後:
- Gemini Enterprise 會將搜尋查詢直接傳送至 Microsoft API。
- Gemini Enterprise 會結合並顯示各個連結資料來源的結果,提供詳盡的搜尋結果。
資料處理
使用第三方聯合搜尋功能時,適用下列資料處理規則:
- 查詢字串會傳送至第三方搜尋後端 (Microsoft API)。
- 這些第三方可能會將查詢與您的身分建立關聯。
- 如果啟用多個聯合搜尋資料來源,查詢可能會傳送至所有來源。
- 一旦第三方系統收到資料,這些資料就受到該系統的《服務條款》和《隱私權政策》規範。
後續步驟
- 如要提供查詢 Microsoft OneDrive 資料的使用者介面,請建立應用程式,然後將應用程式連結至 Microsoft OneDrive 資料儲存庫。
- 如要查看動作清單,請參閱查看動作。
- 如要在設定應用程式後預覽搜尋結果的顯示方式,請參閱「取得搜尋結果」。
- 如要為資料儲存庫啟用警告,請參閱「為第三方資料儲存庫設定警告」。