Looker 對話式數據分析總覽

對話式數據分析是「與資料對話」功能,由 Gemini for Google Cloud 支援。對話式數據分析以 Looker 語意模型層為基礎,可讓機構中的使用者以日常用語提問資料相關問題,取得受管理且值得信賴的自助式商業智慧資訊。這種做法提供企業級管理和安全防護,可加快貴機構採用分析技術的速度。

對話式數據分析功能適用於 Looker (Google Cloud Core) 和 Looker (原始版本) 執行個體。

瞭解 Gemini for Google Cloud 如何使用您的資料

主要功能與特色

對話式數據分析包含下列主要功能:

  • 與 Looker 探索對話:在 Looker (原始版本) 或 Looker (Google Cloud Core) 執行個體中,以自然語言與 Looker 探索資料或自訂資料代理程式對話。一次最多可與五個探索對話。
  • 建立及管理資料代理:您可以提供與資料相關的情境和指示,自訂 AI 輔助資料查詢代理,協助資料代理產生更準確且符合情境的回覆。你也可以與其他使用者共用資料代理程式,讓他們在相同脈絡下提問。您可以將代理程式連結至最多五個探索。
  • 使用程式碼解譯器進行進階數據分析 [預先發布版]:對話式數據分析中的程式碼解譯器會將自然語言問題轉換為 Python 程式碼,並執行該程式碼。相較於以標準 SQL 為基礎的查詢,程式碼解譯器使用 Python 進行的分析和視覺化作業更為複雜。
  • 在網站或應用程式中嵌入對話式數據分析:您可以使用 HTML iframe 標記,在網站或應用程式中嵌入對話式數據分析,就像其他 Looker 內容類型一樣。對話式數據分析支援私人嵌入 (使用者透過 Looker 登入驗證) 和簽署嵌入 (使用者透過自有應用程式驗證)。

對話式數據分析的運作方式

對話式數據分析會使用 Gemini 解讀自然語言問題,並根據 Looker 中的資料提供答案。 Google Cloud 這項功能會使用 Looker 語意模型 (資料的 LookML 定義) 做為單一資料來源,確保回覆內容準確一致。對話式數據分析可解讀 LookML 中定義的「收益」或「流失」等指標的業務定義,並使用這些定義提供準確一致的答案。

為確保回覆內容符合您的特定資料和業務情境,對話式數據分析會採用多種技術:

  • LookML 結構定義:在要求開始時,對話式數據分析會從與其連結的探索擷取結構定義。對話式數據分析會以多種方式使用 LookML 模型中的參數:
    • 欄位識別:結構定義中的中繼資料可協助對話式數據分析找出相關欄位。這類中繼資料包括 LookML 參數,例如 namelabeldescriptiontypedimension_group。這些參數可協助對話式數據分析將使用者問題中的字詞對應至正確的欄位。舉例來說,description 可以提供特定業務的術語或欄位背景資訊。
    • 回覆格式:對話式數據分析會使用 label 參數為欄位命名,方便使用者辨識,並使用 value_format 參數設定回覆中的資料格式。
  • 查詢產生:對話式數據分析會判斷查詢中應使用的欄位、篩選器、排序方式和限制,而不是直接查詢資料庫。接著,Looker 會使用基礎 LookML 模型編寫及執行查詢。這個程序與使用者與「探索」介面互動的方式類似;對話式數據分析不需要瞭解複雜的聯結邏輯或欄位定義,因為 Looker 會根據 LookML 模型處理查詢組成。系統會生成查詢,確保所有查詢都符合 LookML 模型中定義的聯結邏輯、篩選條件、匯總和資料權限。如要產生查詢,對話式數據分析必須判斷要在篩選條件中使用的正確值。這些值必須與基礎資料中的值完全相符,或是更進階的篩選運算式 (例如萬用字元)。為解決使用者在自然語言問題中加入的值,與篩選器可能需要的確切值之間的差異,對話式數據分析會使用 parameter 欄位中以 allowed_value 定義的值,並可使用工具檢查欄位中的特定值:
    • 範例資料:從欄位傳回最多 100 個值,協助對話式數據分析瞭解模式,或找出篩選條件值的完全比對項目。
    • 模糊搜尋:根據使用者輸入內容產生一組搜尋字詞,並檢查維度中是否有這些字詞,找出適當的篩選條件值。樣本資料和模糊搜尋都使用 Looker 的建議 API,因此會受到 LookML 參數 (例如 suggestionssuggest_exploresuggest_dimension) 影響。
  • 分析:Looker 執行查詢後,對話式數據分析會分析查詢結果,回答使用者問題。對話式數據分析可透過下列一或多種方式分析結果:
    • 這項功能會運用內建的 Gemini 功能解讀及摘要結果。
    • 並透過 Code Interpreter 執行 Python 程式碼,進一步分析結果。
    • 並根據查詢結果建立視覺化圖表。

運用 Looker 語意模型,對話式數據分析可存取各種平台 (例如 BigQuery、AlloyDB、Redshift、Snowflake 和 Databricks) 的資料,不必瞭解基礎資料的複雜性,並確保所有回覆內容一致且受控。

對話式數據分析資料代理程式的運作方式

對話式數據分析資料代理會根據兩項主要輸入內容回覆:執行個體的 LookML 結構定義 (由 Looker 開發人員定義),以及您在建立代理時撰寫的代理指令。

資料代理程式必須根據查詢內容,判斷要選取哪些 LookML 欄位,以及要套用哪些篩選器、排序或限制。為此,它會透過下列方式,將查詢中的自然語言對應至本身的代理程式指令和資料的 LookML 結構定義:

  1. 對應語意字詞:使用者經常在問題中使用商業術語。代理程式會使用代理程式指令和 LookML 欄位中繼資料解讀查詢。 舉例來說,如果查詢「我們做了多少新業務?」,資料代理程式就能將「新業務」對應至計算每月經常性收益的測量指標。以「誰是我們的頂尖顧客?」這個查詢為例,資料代理程式會將「頂尖」對應至使用次數,並將「顧客」對應至名為「顧客名稱」的維度。
  2. 對應欄位值:代理程式會使用專用工具對資料取樣或執行模糊搜尋,尋找特定資料點,例如「加州」或「窄版牛仔褲」。舉例來說,如果使用者要求「牛仔褲」,代理程式可能會在「產品名稱」欄位中觸發模糊搜尋,在資料庫中找出完全相符的字串。如果使用者要求「NY」,這是城市欄位還是欄位?代理人可能需要對資料取樣,查看哪個欄位包含「NY」,或提出釐清問題。
  3. 使用查詢範例進行修正:您可以在資料代理指令中提供具體問答範例 (稱為「精確查詢」),提高常見或重要查詢的準確率。

接著,Looker 會使用這些欄位的 LookML 定義,以及「探索」中定義的其他邏輯 (包括欄位定義、存取權限使用者屬性,或是複雜的 Liquid 或彙整邏輯),編寫傳送至資料庫的查詢。由於代理程式不會編寫整個 SQL 查詢,因此不需要「瞭解」資料,可以更準確且確定地運作。

資料代理與對話

與單一探索進行標準對話相比,建立資料代理有幾項主要優勢。從探索開始對話可快速以自然語言查詢特定資料來源,而資料代理則可做為專屬的獨立分析師,在貴機構中自訂及共用。

與「探索」對話相比,資料代理程式具有下列優勢:

  • 與多個探索對話:與探索對話時,一次只能查詢一個探索。不過,資料代理程式最多可以連結五個不同的探索,讓使用者執行跨網域分析,並獲得更全面的答案。
  • 撰寫的背景資訊:您可以為資料代理提供標準「探索」對話中沒有的自訂指令,包括下列資源:
    • 精確查詢:您可以提供自然語言問題和經過驗證的 Looker 查詢配對給代理程式,藉此錨定常見的業務模式,並大幅減少模型的不確定性。
    • 業務詞彙表:您可以在代理程式的指令中直接定義機構專用的術語或縮寫。
    • 角色框架:您可以為代理指派特定角色或專業領域,為對話設定一致的語氣和專業判斷。
  • 代理專業化:您可以為不同業務部門建立專屬代理,例如收益代理Ops Agent,不必使用單一通用對話介面。這樣一來,使用者就能獲得更明確的分析指引,找出最符合需求的特定欄位和篩選器。
  • 協作和重複使用:探索對話通常僅限一位使用者,但資料代理程式可以機構的其他成員共用。共用可確保多位使用者都能享有管理員或資料專家開發的相同撰寫內容和控管機制。
  • 自訂行為:您可以設定代理程式在嚴格的條件下運作,例如使用預設篩選條件,像是「如果沒有提及時間範圍,一律預設為過去 6 個月」。這些控管措施可確保代理程式在貴機構的特定治理和安全標準內運作。您也可以在「探索」中隱藏欄位,避免資料代理程式在查詢中使用這些欄位。

說明文件清單

瞭解 Gemini in Looker 功能的法規遵循能力

對話式數據分析尚未納入 FedRAMP 高或 FedRAMP 中等授權範圍。為 Looker 執行個體啟用 Gemini in Looker 設定前,請先與授權機構討論,確認 Gemini for Google Cloud 的法規遵循要求是否符合貴機構的需求。 Google Cloud

對於 Looker (Google Cloud Core) 執行個體,每當有新的Assured Workloads 控制套件推出,只要符合該套件的變更需求和程序,Gemini in Looker 功能就會成為預設選項。Looker 中的對話式數據分析功能會遵守相關聯 Looker (Google Cloud Core) 執行個體的法規遵循功能,但有以下例外狀況:

所有 Looker 客戶都能使用資料落地 (DRZ) 支援服務,特別是靜態資料。與對話式數據分析相關的所有待用資料,都嚴格存放在 Looker 執行個體中,且僅限於單一區域。傳輸中的資料可能會透過全球服務處理。

提供意見回饋

如要對「對話式數據分析」中的個別回覆提供意見回饋,請選取下列其中一個選項:

  • thumb_up「答得好」:表示回覆內容實用。
  • thumb_down 有待加強:表示回覆內容沒有幫助。