將 TensorFlow 企業版與深度學習 VM 搭配使用

本頁面簡要介紹深度學習 VM 映像檔,並說明如何開始將 TensorFlow 企業版與深度學習 VM 執行個體搭配使用。

在本範例中,您會建立 TensorFlow 企業版深度學習 VM 執行個體、使用 SSH 連線至該執行個體、開啟 JupyterLab 筆記本,並執行分類教學課程,瞭解如何搭配使用 Keras 和類神經網路。

深度學習 VM 總覽

深度學習 VM 映像檔是一系列針對資料科學和機器學習工作最佳化的虛擬機器映像檔。所有映像檔都預先安裝了關鍵機器學習架構和工具。您可以在具有 GPU 的執行個體上直接使用這些映像檔,加快資料處理工作的速度。

深度學習 VM 映像檔支援多種架構和處理器組合。目前映像檔可支援 TensorFlow 企業版、TensorFlow、PyTorch 和一般高效能運算,並提供只使用 CPU 和已啟用 GPU 工作流程的版本。

如要查看可用架構清單,請參閱「選擇映像檔」。

事前準備

  1. 登入 Google Cloud 帳戶。如果您是 Google Cloud新手,歡迎 建立帳戶,親自評估產品在實際工作環境中的成效。新客戶還能獲得價值 $300 美元的免費抵免額,可用於執行、測試及部署工作負載。
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Verify that billing is enabled for your Google Cloud project.

建立深度學習 VM 執行個體

如要建立 TensorFlow 企業版深度學習 VM 執行個體,請完成下列步驟:

  1. 前往 Google Cloud 控制台的「Deep Learning VM Cloud Marketplace」(深度學習 VM Cloud Marketplace) 頁面。

    前往 Deep Learning VM Cloud Marketplace 頁面

  2. 按一下 [Launch on Compute Engine] (在 Compute Engine 上啟動)。如果看到專案選取視窗,請選擇要在哪個專案中建立執行個體。如果這是您第一次啟動 Compute Engine,請等待初始 API 設定程序完成。

  3. 在「New Deep Learning VM deployment」(新的深度學習 VM 部署作業) 頁面中,輸入「Deployment name」(部署作業名稱)。這會是您虛擬機器名稱的根。Compute Engine 在建立執行個體時,會在這個名稱後方加上 -vm

  4. 在「Number of GPUs」(GPU 數量) 下方,選取「None」(無)。您不需要這些權限,即可完成本指南中的說明。

  5. 在「框架」下方,選取「TensorFlow 企業版 2.3 (CUDA 11.0)」

  6. 在本範例中,其餘設定可維持不變。

  7. 點選「Deploy」(部署)

您剛剛建立了第一個深度學習 VM 執行個體。執行個體建立完成後,系統會開啟「Deployment Manager」。您可以在這裡管理深度學習 VM 執行個體和其他部署作業。

使用 SSH 連線、開啟筆記本,然後執行分類教學課程

完成下列步驟,設定與 Deep Learning VM 執行個體的 SSH 連線、開啟 JupyterLab 筆記本,並執行使用 Keras 搭配類神經網路的教學課程:

  1. 如要完成這些步驟,請使用 Cloud Shell 或任何可安裝 Google Cloud CLI 的環境。您可以使用 gcloud CLI 與執行個體互動。

    • 如要使用 Cloud Shell,請在 Google Cloud右上角點選「啟用 Cloud Shell」按鈕。

      Google Cloud Platform 主控台

    • 如要使用 gcloud CLI,請在本機下載並安裝 Google Cloud CLI

  2. Cloud Shell 或本機終端機視窗中,使用下列指令建立與執行個體的 SSH 連線。將 my-project-idmy-zonemy-instance-name 替換為相關資訊。

    gcloud compute ssh --project my-project-id --zone my-zone \
      my-instance-name -- -L 8080:localhost:8080
    
  3. 使用本機瀏覽器前往 http://localhost:8080,存取執行個體預設隨附的 JupyterLab 筆記本。

  4. 在筆記本左側,按兩下「tutorials」開啟資料夾,然後前往並開啟「tutorials/tf2_course/01_neural_nets_with_keras.ipynb」

  5. 按一下執行按鈕 ,執行教學課程的儲存格。

後續步驟