使用筆記本庫建立及執行筆記本

使用 BigQuery Studio 的筆記本庫,開始分析資料。

事前準備

  1. 登入 Google Cloud 帳戶。如果您是 Google Cloud新手,歡迎 建立帳戶,親自評估產品在實際工作環境中的成效。新客戶還能獲得價值 $300 美元的免費抵免額,可用於執行、測試及部署工作負載。
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  6. 啟用 BigQuery API。

    啟用 API 時所需的角色

    如要啟用 API,您需要服務使用情形管理員 IAM 角色 (roles/serviceusage.serviceUsageAdmin),其中包含 serviceusage.services.enable 權限。瞭解如何授予角色

    啟用 API

    新專案會自動啟用 BigQuery API。

  7. 選用: 啟用專案的計費功能。如果您不想啟用帳單或提供信用卡,仍可按照本文步驟操作。BigQuery 提供沙箱,方便您執行這些步驟。詳情請參閱「啟用 BigQuery 沙箱」一文。

必要的角色

如要取得建立執行筆記本所需的權限,請要求管理員授予您專案的下列 IAM 角色:

如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。

您或許也能透過自訂角色或其他預先定義的角色,取得必要權限。

如果您剛開始使用 BigQuery 筆記本,請參閱「建立筆記本」頁面上的必要權限

筆記本庫是探索及使用預先建構筆記本範本的中心。這些範本可讓您執行資料準備、資料分析和視覺化等常見工作。筆記本範本也有助於探索 BigQuery Studio 功能、管理工作流程,以及推廣最佳做法。

您可以使用筆記本範本庫,簡化資料生命週期各階段的意圖到洞察工作流程,包括擷取和探索資料,以及進階分析和 BigQuery ML。

筆記本庫提供各種技能程度適用的範本。這個範本庫提供 SQL、Python、Apache Spark 和 DataFrame 的基本範本。您也可以探索 BigQuery 中的生成式 AI 和多模態資料分析等主題。

如要進一步瞭解如何使用筆記本庫範本,請參閱「使用筆記本庫建立筆記本」。

以下範例使用「BigQuery Studio 筆記本簡介」範本。這個筆記本會說明如何執行下列工作:

  • 查詢資料:使用 SQL 儲存格執行查詢。
  • 以圖表呈現查詢結果:使用圖表儲存格,不必編寫程式碼即可建立圖表。
  • 清理及轉換資料:使用 BigQuery DataFrames (pandas) API 排序、去重複及篩選資料。
  • 執行 AI 預測:使用 BigQuery DataFrames 中的 (AI.FORECAST 函式) 生成預測結果。AI.FORECAST 函式會使用 TimesFM 基礎模型,直接從資料集產生預測結果,不需要訓練模型。
  • 繪製資料圖表:使用 Python 的內建視覺化程式庫繪製資料圖表。您可以使用 BigQuery DataFrames 視覺化程式庫 (由 Matplotlib 和 Pandas 提供技術支援) 繪製資料圖表。

如要使用筆記本,請開啟範本、將範本轉換為可執行的筆記本、連線至筆記本的執行階段環境,然後執行筆記本。

開啟範本並轉換為可執行的筆記本

如要使用從筆記本庫範本建立的筆記本,請先將範本轉換為可執行的筆記本。

如要在筆記本範本庫中開啟「BigQuery Studio 筆記本簡介」範本,並將其轉換為可執行的筆記本,請按照下列步驟操作:

  1. 前往「Studio」(工作室) 頁面。

    前往 Studio

  2. 按一下 箭頭下拉式選單,然後依序選擇「筆記本」> 所有範本

  3. 或者,在 BigQuery Studio 首頁中,按一下「查看筆記本庫」

    BigQuery Studio 首頁上的「查看筆記本庫」連結。

  4. 按一下「BigQuery Studio 中的筆記本簡介」資訊卡,或在範本庫中搜尋該資訊卡。

  5. 範本開啟後,按一下「使用這個範本」,將範本轉換為可執行的筆記本。

連線至預設執行階段

如要執行筆記本,必須先將筆記本連結至 Vertex AI 執行階段。執行階段是運算資源,可執行筆記本中的程式碼。執行階段必須與筆記本位於相同區域。

如要進一步瞭解執行階段,請參閱執行階段和執行階段範本。如要進一步瞭解如何設定區域設定,請參閱「設定程式碼資產的預設區域」。

在本教學課程中,您將使用預設執行階段。預設執行階段是預先設定的執行階段,只需進行最少的設定。如要連線至預設執行階段,請按照下列步驟操作:

  1. 開啟筆記本後,按一下「連結」

    如果沒有啟用的執行階段,連線至預設執行階段可能需要幾分鐘的時間。

  2. 執行階段就緒後,您應該會看到勾號,以及顯示 RAM 和磁碟的圖表。將游標懸停在圖表上,即可查看執行階段類型和執行階段設定。

    預設執行階段的設定

執行筆記本

BigQuery Studio 筆記本簡介包含文字、SQL、圖表和程式碼儲存格。文字儲存格以外的儲存格可以個別執行,也可以依序執行所有儲存格。

在本教學課程中,您會個別執行筆記本中的儲存格,以便分階段查看結果。如要執行筆記本:

  1. 在「使用 SQL 儲存格查詢資料」部分,將游標懸停在 SQL 儲存格上, 然後按一下「執行儲存格」圖示

    SQL 儲存格中的「執行儲存格」按鈕

    這個 SQL 儲存格會查詢歷史空氣品質公開資料集中的bigquery-public-data.epa_historical_air_quality.pm25_frm_daily_summary資料表,並傳回舊金山過去幾年的每日平均 PM2.5 (常見的空氣品質指標)。

  2. 查看結果。查詢結果會顯示在 DataFrame 中。

    BigQuery DataFrames 中的查詢結果

  3. 在「Visualize data」(資料視覺化) 區段中,將游標懸停在視覺化儲存格上,然後按一下 「Run cell」(執行儲存格)

  4. 查看生成的視覺化內容。

    圖表儲存格產生的圖表

    結果會顯示時序圖,繪製您先前產生的 df DataFrame 中每日平均 PM2.5 值。這張圖表顯示 PM2.5 濃度隨時間變化的趨勢。

  5. 在「Clean the data」(清除資料) 部分,將游標懸停在程式碼儲存格上,然後按一下「Run cell」(執行儲存格)

  6. 查看結果。結果會顯示在 DataFrame 中。

    BigQuery DataFrames 中的結果

    該程式碼會執行以下作業:

    • 匯入 bigframes.pandas 程式庫。
    • 確認 date_local 欄位是時間戳記。
    • 依日期排序結果,這是預測的必要條件。
    • 移除重複的資料列。
    • 捨棄 avg_pm25null 的資料列。
    • 篩選離群值。
    • 在名為 df_cleaned 的 BigQuery DataFrames 中顯示結果。
  7. 在「Predict values using AI.FORECAST」(使用 AI.FORECAST 預測值) 區段中,將滑鼠游標懸停在 SQL 資料格上,然後按一下「執行資料格」

  8. 查看結果。查詢結果會顯示在 DataFrame 中。

    `AI.FORECAST` 函式產生的結果

    這個 SQL 儲存格會執行查詢,使用 AI.FORECAST 函式,根據您先前產生的 df_cleaned DataFrame,預測未來的每日平均 PM2.5。

  9. 在「Visualize data using Python」(使用 Python 繪製資料圖表) 專區中,將滑鼠游標懸停在程式碼儲存格上,然後按一下 「Run cell」(執行儲存格)

  10. 查看結果。結果會顯示在圖表中。

    Python 程式碼儲存格產生的圖表

    Python 程式碼會執行下列作業:

    • 匯入 datetime 模組。
    • 先繪製歷來資料,然後取得座標軸。
    • 在相同座標軸上繪製預測資料。
    • 繪製信賴區間。

    這個視覺化圖表與標準 Python 繪圖類似,但 df_cleaned.plot 是 BigQuery DataFrames 指令。這項指令只會擷取繪製圖表所需的資料 (樣本),不會擷取整個資料集。

清除所用資源

為了避免系統向您的 Google Cloud 帳戶收取本頁面所用資源的費用,請按照下列步驟操作。

  1. 前往 Google Cloud 控制台的「Manage resources」(管理資源) 頁面。

    前往「Manage resources」(管理資源)

  2. 在專案清單中選取要刪除的專案,然後點選「Delete」(刪除)
  3. 在對話方塊中輸入專案 ID,然後按一下 [Shut down] (關閉) 以刪除專案。

如要保留專案,但刪除本教學課程中使用的資源,請按照下列步驟操作:

  1. 前往「Studio」(工作室) 頁面。

    前往 Studio

  2. 在左側窗格中展開專案,然後按一下「Notebooks」

  3. 找出要刪除的筆記本,然後依序點選 「Open actions」(開啟動作)>「Delete」(刪除)

  4. 在「刪除記事本」對話方塊中,按一下「刪除」以確認。

後續步驟

如要在筆記本庫中執行其他範例筆記本範本,請參閱:

如要進一步瞭解 DataFrame,請參閱:

如要進一步瞭解 BigQuery 中的生成式 AI 和 ML 函式,請參閱生成式 AI 總覽