使用 Gemini Cloud Assist
本文說明如何使用 Gemini for Google Cloud 系列產品 Gemini Cloud Assist,瞭解及處理 BigQuery 中的中繼資料、工作和查詢。這份文件提供支援的用途和範例提示,您可以在 Gemini Cloud Assist 中使用。
事前準備
如要使用 Gemini Cloud Assist,管理員必須先為您使用的專案或資料夾設定 Gemini Cloud Assist。
為支援有關 Google Cloud 資源的問題和要求,Gemini Cloud Assist 必須具備這些資源的適當身分與存取權管理 (IAM) 權限。當您提示 Gemini Cloud Assist 查詢 BigQuery 資料時,系統會沿用您的權限,因此在許多情況下,必要的 IAM 權限已授予。詳情請參閱「使用 Gemini Cloud Assist 的 IAM 需求」。
使用 Gemini Cloud Assist
前往「BigQuery」頁面
在 Google Cloud 工具列,點選 spark「Open or close Gemini AI chat」,開啟 Gemini Cloud Assist 對話。
在「輸入提示」欄位中輸入提示。
依序按一下「傳送」「傳送」。
以下各節提供 Gemini Cloud Assist 可執行的工作範例,以及範例提示。
探索資源
搜尋及瞭解單一專案或多個專案中的資料集和表格資源。Gemini Cloud Assist 會使用 Knowledge Catalog 搜尋 BigQuery 資源。系統會使用您的權限執行搜尋。舉例來說,如果您沒有權限查看資源的中繼資料,該資源就不會顯示在結果中。支援的用途包括:
按照名稱搜尋資源。在「Cloud Assist」面板中,輸入類似下列內容的提示:
我是否有任何名為「ecommerce」的資料集?詢問資料表的中繼資料。您可以依名稱詢問資料表,也可以讓 Gemini Cloud Assist 根據您的對話記錄或作用中查詢分頁中參照的資料表,推斷您要詢問的資料表。如果您依名稱指定資料表,則必須使用完整名稱。您可以詢問資料表的結構定義或其他中繼資料,例如分割和叢集。在「Cloud Assist」面板中,輸入類似下列的提示:
「PROJECT_NAME.DATASET_NAME.TABLE_NAME」的結構定義是什麼?詢問特定資訊的所在位置。在「Cloud Assist」面板中,輸入類似下列內容的提示:
哪裡可以查看過去一年新使用者的年齡和所在地等客層資料?
生成程式碼
您可以使用 Gemini Cloud Assist 生成 SQL 和 Python 程式碼,協助查詢及分析資料。
生成 SQL 查詢
說明查詢的用途,即可生成 SQL 查詢。如要獲得最佳結果,請加入要查詢的資料表名稱。舉例來說,在「Cloud Assist」面板中,輸入類似下列內容的提示:
生成 SQL 查詢,顯示時間最長的前十趟行程的時長和訂閱者類型。使用 bigquery-public-data.san_francisco_bikeshare.bikeshare_trips 表格。
生成 Python 程式碼
只要說明您想執行的動作,Gemini 就能生成 Python 程式碼。舉例來說,您可以在「Cloud Assist」面板中輸入下列提示,要求 Gemini 使用 BigQuery Magic 語法查詢公開資料集的 penguins 資料表:
生成 Python 程式碼,使用 BigQuery magic 查詢 bigquery-public-data.ml_datasets.penguins 資料表。
排定查詢時程
在提示中提供下列詳細資料,即可排定查詢時間:
- 排程,例如每週一下午 5 點或每隔週的星期二凌晨 2 點
- 顯示名稱
- 目的地資料表 ID 和目的地資料集 ID
- 開始時間
- 結束時間
- 寫入配置,例如
WRITE_EMPTY、WRITE_APPEND或WRITE_TRUNCATE
舉例來說,您可以在「Cloud Assist」面板中輸入類似下列的提示:
Schedule the query open in the editor to run daily. The display name
should be "test query". Write the results to a new table in mydataset
called scheduled_results. Use WRITE_APPEND. Start it now.
追蹤資料歷程
您可以使用 Gemini Cloud Assist 探索及分析資料沿襲。這項功能可協助您瞭解資料依附元件、評估結構變更的影響,以及匯總複雜的資料流程。如要分析歷程,您可以問問 Gemini Cloud Assist 下列功能領域的問題:
取得沿襲統計資料。請 Gemini Cloud Assist 提供沿襲圖的量化資料,例如涉及的資產、資料集或專案總數。在「Cloud Assist」面板中,輸入類似下列的提示:
Customer_Master 有多少上游資產?Customer_Interaction_Summary 的上游歷程中涉及多少個 BigQuery 資料集?提供 Marketing_Interaction 上游圖表中所有不重複資產的數量。
分析直接依附元件:分析單一躍點關係,找出特定資產的直接父項 (來源) 或直接子項 (消費者)。在「Cloud Assist」面板中,輸入類似下列內容的提示:
Customer_Master 的直接來源為何?哪些是 Card_Master 資料表的直接消費者?Web_Session_Validated 的直接來源為何?
評估下游影響:瞭解修改或捨棄資產的下游影響。您可以依深度 (躍點數) 或特定專案界線,設定這些提示的範圍。在 Cloud Assist 面板中,輸入類似下列的提示:
如果我捨棄 Customer_Master,哪些資產會受到影響?Show me the assets downstream from Customer_Master within 2 hops.變更 Customer_Master 是否會影響「data-lineage-manual-tests」專案中的任何資產?
找出根本來源和最終目的地。找出資料的最終來源或終點,略過中間的轉換步驟。在「Cloud Assist」面板中輸入類似下列的提示:
Customer_Master 的所有最終資料來源為何?Transaction_Data_Enriched 的原始資料來源為何 (不含中繼表格)?Card_Data_Validated 中的資料最終會傳送到哪些目的地?
追蹤資產之間的資料流。請 Gemini Cloud Assist 說明兩個已知資產之間的特定連線、路徑或資料流。在「Cloud Assist」面板中,輸入類似下列的提示:
Customer_Master 如何依附於 Customer_Data_Raw?資料流程如何從 Customer_Data_Raw 流向 Customer_Profile_Snapshot?Customer_Data_Raw 和 Alert_Fact 之間有多少躍點?
依資產類型或名稱篩選沿襲。搜尋特定類型的連結資產 (例如 BigQuery 檢視區塊或 Looker 資訊主頁),或符合特定命名模式的資產。在「Cloud Assist」面板中,輸入類似下列內容的提示:
Customer_Master 是否用於任何 BigQuery 檢視區塊?Customer_Master 的下游是否有任何 Looker 資訊主頁?What upstream tables of Customer_Master have 'Country' in their name?
摘要顯示沿襲圖表:要求以自然語言提供資產沿襲的總覽,而非特定清單或計數。在 Cloud Assist 面板中,輸入類似下列的提示:
請提供依附於 Web_Session_Validated 的資產摘要。生成這個資料表的下游沿襲摘要。bigquery:PROJECT_NAME.DATASET_NAME 的歷程為何?
分析工作
進一步瞭解專案中執行的工作,包括個人工作記錄和專案工作記錄,以支援下列用途:
偵錯長時間執行的查詢。瞭解工作的目前狀態,以及工作時間可能比預期長的原因,例如時段爭用、掃描大量資料列、資料量過大等。在「Cloud Assist」面板中輸入類似下列內容的提示:
為什麼這項工作耗時這麼久?JOB_ID分析工作失敗的原因。瞭解特定查詢失敗的原因。在「Cloud Assist」面板中,輸入類似下列內容的提示:
為什麼「JOB_ID」失敗?找出耗用大量資源的查詢。根據預估處理的位元組數,瞭解費用最高的查詢。在「Cloud Assist」面板中,輸入類似下列內容的提示:
過去 2 天內,我執行的 3 項最昂貴查詢為何?
管理 BigQuery
在「作業」探索器中,您可以與 Gemini Cloud Assist 對話,監控效能、分析容量及最佳化成本。舉例來說,您可以使用 Gemini Cloud Assist 執行下列工作:
分析預訂和容量。使用自然語言監控運算資源用量,並找出瓶頸。在 Cloud Assist 面板中,您可以輸入類似下列的提示:
分析我過去 24 小時的預訂成效。顯示使用我「生產」保留項目的前幾項專案和使用者。目前的容量是否足以負荷尖峰用量?
監控及比較工作。比較工作負載,瞭解效能變化。您可以取得工作成效摘要,其中會醒目顯示瓶頸和最佳化機會,也可以直接比較不同工作的執行詳細資料,找出回歸或改善項目。
工作負載管理設定:使用自然語言檢查及管理 BigQuery 預留設定,包括指派和承諾。這項功能可讓您瞭解自動調整設定、閒置時段管理和版本專屬詳細資料。在「Cloud Assist」面板中,您可以輸入類似下列的提示:
列出我的自動調度資源預留項目。取得 PROJECT_ID 的指派項目。我的預訂RESERVATION_NAME設定為何?列出我的承諾。有多少預訂項目已設定忽略閒置時段?列出 Enterprise 版的所有預訂項目。列出所有目前的預訂項目,並顯示每個項目的 slot_capacity 和 autoscale_max_slots。
熱門資源識別。找出 BigQuery 資源的主要消費者。助理會根據特定專案或預訂項目中的運算單元使用率,顯示頂尖使用者和工作。這項服務可為重要的 BigQuery 資源提供全面的管理支援,包括工作、使用者、專案和預留容量。這項助理會分析時段使用情況和工作持續時間等主要成效指標,提供實用洞察資料,協助您簡化監控作業及最佳化資源分配。在 Cloud Assist 面板中,您可以輸入類似下列的提示:
專案中哪些使用者最常使用配額?Show me the top jobs consuming the most slots in reservation RESERVATION_NAME in the last hour.
最佳化查詢
使用 Gemini Cloud Assist 分析 SQL 查詢,並取得最佳化建議。Gemini Cloud Assist 會分析查詢結構,並建議改善方式,盡可能縮短查詢時段。您可以使用下列任一方法最佳化查詢:
在查詢編輯器中,按一下「最佳化」。只有在使用 BigQuery 版本時,才會顯示這個按鈕。
前往「BigQuery」頁面
在查詢編輯器中輸入並執行 SQL 查詢。
在查詢編輯器工具列中,按一下「最佳化」。 Gemini Cloud Assist 會分析執行的查詢,並在「Cloud Assist」面板中顯示建議。
使用 Cloud Assist 面板。您可以開啟現有分頁中的查詢,或直接將 SQL 程式碼貼到「Cloud Assist」面板,然後要求最佳化。無論您使用容量價格 (BigQuery 版本) 或隨選價格,所有客戶都能使用這項功能。