创建 GPU 加速的 Linux 虚拟工作站

本教程介绍如何创建具备以下特点的 Linux 虚拟工作站：运行 Ubuntu 22.04，且挂接了具备显示能力的 GPU。Google Cloud 提供了四种具备显示能力的 GPU：NVIDIA L4、NVIDIA T4、NVIDIA P4 和 NVIDIA P100。

如需创建 Windows 工作站，请参阅有关创建 GPU 加速的 Windows 虚拟工作站的教程。

创建虚拟工作站后，您将学习如何使用HP Anywhere（以前称为 Teradici CAS）和 PC-over-IP (PCoIP®) 远程访问该工作站。PCoIP 是广泛应用于媒体娱乐、游戏开发、架构和工程行业的远程桌面协议。PCoIP 提供了对这些类型的工作负载至关重要的功能，例如色彩精确度、对多个显示器的支持、无损显示以及平板电脑压力灵敏度。

本教程假定您熟悉 Linux 命令行。

目标

创建带有 GPU 的 Compute Engine 实例。此实例是虚拟工作站的基础。
在虚拟工作站上安装 NVIDIA 驱动程序。
在虚拟工作站上安装 HP Anyware 软件。
使用 PCoIP 软件客户端连接到虚拟工作站。

费用

本教程使用 Google Cloud的以下收费组件：

Compute Engine

您可使用价格计算器根据您的预计用量来估算费用。

虚拟工作站的构成资源以及影响本教程中所述费用的因素包括：

8 个 vCPU、32 GB RAM G2 标准机器类型，其中包括一个 NVIDIA L4 虚拟工作站 GPU。
500 GB SSD 永久性启动磁盘。
互联网出站数据传输费用

互联网数据传输表示从虚拟工作站流向本地显示客户端的数据，按互联网出站数据传输费用计费。影响 PCoIP 会话期间数据传输的变量包括带宽、屏幕分辨率、显示器数量、使用的应用以及每个显示器上的活动类型。如需了解不同的工作负载要求，请参阅 HP Anyware 会话规划指南。

准备工作

本教程使用 Google Cloud CLI，您可以从通过 Google Cloud console 启动的 Cloud Shell 实例运行它。如果您要在本地工作站上使用 gcloud CLI，请安装 Google Cloud CLI。本教程将向您介绍如何在 Cloud Shell 中运行命令；如果您在工作站上使用 gcloud CLI，请相应地调整指令。

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Compute Engine API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Compute Engine API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

此外，请确保满足以下条件：

一个 Google Cloud 项目，该项目在您所选可用区中拥有 NVIDIA L4 虚拟工作站 GPU 配额。您可以使用 gcloud compute accelerator-types list 命令获取 GPU 可用性信息列表。
Google Chrome 浏览器（用于访问 Google Cloud 控制台）。
Windows、Mac 或 Linux 版最新 PCoIP 客户端软件（用于访问虚拟工作站）。
help.teradici.com 上的账号（用于下载 HP Anyware 软件）。注册账号是免费的。
HP Anyware 软件许可。您可以申请试用许可，或联系您的 HP 代表索取此虚拟工作站的试用注册代码。

架构

下图显示了本教程中用于部署单个虚拟工作站的组件。图中显示的可选组件包括用于连接到虚拟工作站、对象和共享存储空间的几种不同方式，用于提供第三方许可的另外一个实例，以及代表渲染或计算场的其他基础架构。

虚拟工作站架构。

选择一个区域。

部署虚拟工作站时需要考虑的一项重要因素是您的位置与您创建的实例之间的延迟时间。延迟时间越短，体验越好。因此，您最好选择与您的地理位置最近的可用区。如需详细了解不同 GPU 的可用位置，请参阅 GPU 区域和可用区可用性。

打开 Cloud Shell。（如果您使用的是 gcloud CLI，请在您的计算机上打开终端窗口。）

转到 Cloud Shell
获取可使用 GPU 的可用区的列表：
```
gcloud compute accelerator-types list
```
记下距您的地理位置最近的区域和可用区。
设置您要使用的可用区：
```
gcloud config set compute/zone ZONE
```
将 ZONE 替换为您所使用的可用区的名称，例如 us-west1-b。

选择机器类型

NVIDIA L4 GPU 会挂接到 G2 机器类型。如果虚拟机挂接了一个或多个 GPU，那么您添加到实例的每个 GPU 都可以配备最多数量的 vCPU。例如，每个 NVIDIA L4 GPU 可让您为实例机器类型配备最多 32 个 vCPU 和高达 128 GB 的内存。要查看不同 GPU 配置的可用 vCPU 和内存范围，请参阅 GPU 列表。

在本教程中的示例中，G2 虚拟工作站拥有 8 个 vCPU，远远低于单个 NVIDIA L4 GPU 可以有 32 个 vCPU 的限制。

创建虚拟工作站

在 Cloud Shell 中，创建 Compute Engine 虚拟工作站实例：

gcloud compute instances create VM_NAME \
    --zone=ZONE \
    --machine-type=MACHINE_TYPE \
    --accelerator=type=ACCELERATOR,count=NUM-GPUS \
    --maintenance-policy="TERMINATE" \
    --image-project=ubuntu-os-cloud \
    --image-family=ubuntu-2204-lts \
    --boot-disk-size=SIZE \
    --boot-disk-type=TYPE \
    --network=NETWORK

替换以下内容：

VM_NAME 是工作站的名称。
ZONE 是要在其中创建虚拟机的可用区。
MACHINE_TYPE 是预定义或自定义机器配置。
ACCELERATOR 是您要挂接的 GPU 的类型，例如 nvidia-l4-vws。
NUM-GPUS 是要挂接到虚拟机的 GPU 数量。
SIZE 是启动磁盘的大小（以 GB 为单位）。
TYPE 是启动磁盘的类型。如需获取可用磁盘类型的列表，请运行 gcloud compute disk-types list。
NETWORK 是要在其中创建虚拟机的网络。

例如：

gcloud compute instances create test-workstation \
    --zone=us-west1-b \
    --machine-type=g2-standard-8 \
    --accelerator=type=nvidia-l4-vws,count=1 \
    --maintenance-policy="TERMINATE" \
    --image-project=ubuntu-os-cloud \
    --image-family=ubuntu-2204-lts \
    --boot-disk-size=100 \
    --boot-disk-type=pd-ssd \
    --network=default

创建虚拟工作站后，系统将显示机器状态。输出类似于以下内容：

NAME: test-workstation
ZONE: us-west1-b
MACHINE_TYPE: g2-standard-8
PREEMPTIBLE:
INTERNAL_IP: 10.138.XX.XXX
EXTERNAL_IP: XX.XXX.XXX.XXX
STATUS: RUNNING

记下虚拟工作站的外部 IP 地址。在本教程的后面部分，您将用到该地址。

您可以随时使用 Google Cloud 控制台检索虚拟工作站的外部 IP 地址。

登录虚拟工作站

创建虚拟工作站后，请登录机器来配置该工作站。

在 Cloud Shell 中，连接到新建的虚拟工作站：
```
gcloud compute ssh VM_NAME
```
设置账号密码。使用 PCoIP 软件客户端登录虚拟工作站需要用户密码。
```
sudo passwd `whoami`
```
出现提示时，输入一个密码。在本教程的后面部分，当您通过 HP Anyware PCoIP 客户端登录您的虚拟工作站，将会用到这个密码。

安装基础库

默认的 Google Cloud Ubuntu 22.04 映像是 Ubuntu 的极简安装。接下来，安装运行虚拟工作站（用作图形工作站）所必需的库。

更新软件代码库：
```
sudo apt update
```

安装基本组件：

sudo apt install -y build-essential
sudo apt install -y libvulkan1

更新 NVIDIA 驱动程序的 gcc 版本：

sudo apt install -y gcc-12
sudo apt install -y linux-headers-$(uname -r)
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 12
sudo update-alternatives --config gcc

安装 NVIDIA 驱动程序

对于可视化工作负载， Google Cloud上的 NVIDIA L4、NVIDIA T4、NVIDIA P4 和 NVIDIA P100 GPU 仅当搭配符合条件的 NVIDIA RTX 虚拟工作站驱动程序时才能正常运行。您可以从一个公共 Google Cloud 存储桶下载这些驱动程序。

如需安装最新的 NVIDIA RTX 虚拟工作站驱动程序，请按照说明（仅限第 3 步和第 4 步）操作。
重启工作站：
```
sudo reboot
```

安装桌面环境

如需将虚拟工作站作为图形工作站运行，必须使用桌面环境。在本教程中，您将安装 KDE Plasma 桌面。

安装桌面环境：

sudo apt update
sudo apt -y install kubuntu-desktop
sudo apt -y install dialog

重启工作站：
```
sudo reboot
```

安装 HP Anyware 软件

HP Anyware 软件提供了一个在虚拟工作站上运行的图形代理，可将桌面传输到硬件或软件客户端。

重启虚拟工作站后，在 Cloud Shell 中重新连接到该虚拟工作站：
```
gcloud compute ssh VM_NAME
```
添加 Teradici 软件代码库：
```
curl -1sLf \
    https://dl.anyware.hp.com/TOKEN/pcoip-agent/cfg/setup/bash.deb.sh \
    | sudo -E distro=ubuntu codename=jammy bash
```
替换以下内容：
- TOKEN 是可从适用于 Linux 的 HP Anyware Graphics Agent 页面中的下载和脚本下检索的下载令牌。
更新软件代码库：
```
sudo apt update
```
可选：如果您需要支持除键盘、鼠标和指控设备以外的 USB 设备，请安装 USB 依赖项。

注意：如果您跳过此步骤，系统会停用 USB 重定向功能。这意味着您无法使用桥接 USB 设备。
```
sudo apt -y install usb-vhci-dkms
```

安装 HP Anyware 软件：

sudo apt -y install pcoip-agent-graphics

注册 Anyware Graphics Agent

如需使用 Anyware Graphics Agent，您必须拥有 HP Anyware 许可。

在 Cloud Shell 中，激活您的 HP Anyware 软件许可：
```
pcoip-register-host --registration-code=REGISTRATION-CODE
```
将 REGISTRATION-CODE 替换为 HP Teradici 以 ABCDEFGHIJKL@0123-4567-89AB-CDEF 的形式提供给您的代码。
重启虚拟工作站：
```
sudo reboot
```

创建防火墙规则

PCoIP 客户端会使用多个端口与虚拟工作站通信。您必须设置允许流量进入您的虚拟工作站的防火墙规则。

在 Cloud Shell（而非虚拟工作站）中，创建用于打开所需端口的防火墙规则：
```
gcloud compute firewall-rules create allow-pcoip \
    --action=ALLOW \
    --rules=tcp:443,tcp:4172,udp:4172 \
    --source-ranges=0.0.0.0/0
```
注意：此防火墙规则允许来自互联网任何地方的流量访问虚拟机实例。请始终遵循防火墙规则的最佳实践，以限制传入您的实例的流量。

使用 PCoIP 客户端登录您的虚拟工作站

在本地计算机上，转到 HP Anyware 支持页面上的 PCoIP 客户端部分，然后下载、安装并启动适用于您的操作系统的 PCoIP 软件客户端应用。
在 Host Address 或 Registration Code 字段中，输入虚拟工作站的外部 IP 地址。如果需要，可以输入连接名称。

注意：默认情况下，PCoIP 流量采用 AES-256 进行了加密。但 HP Anyware 软件使用 Teradici 颁发的自签名证书。因此，在您连接时，可能会触发验证警告。您可以通过创建和安装自己的自定义安全证书来移除此警告。或者，您可以通过更改客户端操作系统的客户端安全模式来禁止该警告。在本教程中，您可以点击对话框中的 Connect Insecurely，以忽略此警告。
连接后，输入之前为虚拟工作站创建的用户名和密码，以进行身份验证。

几秒钟后，将显示 Linux 桌面。

测试虚拟工作站

部署完虚拟工作站后，您可以使用多种工具来测试其性能和交互性：

运行 glxgears、glmark2 或 UNIGINE 等 GPU 基准测试工具，这些工具是在 Linux 工作站上测试图形性能的简易程序。
安装 Unreal Engine、Unity Editor、Blender 或任何内容创建应用。
对于 V-Ray、Octane 或 Maxon 等常用渲染程序，运行渲染基准测试工具。
使用 Google Chrome 来浏览您喜欢的网站或播放 YouTube 视频。

您还可以详细了解基于您的工作负载的 PCoIP 性能优化。

清理

为避免因本教程中使用的资源导致您的 Google Cloud 账号产生费用，请删除包含这些资源的项目，或者保留项目但删除各个资源。

完成本教程后，请清理在Google Cloud 上创建的资源，避免日后再为这些资源付费。

停用虚拟工作站

停用的虚拟工作站会产生永久性磁盘使用费。在停用虚拟工作站后，您随时可以重新启用。要停用虚拟工作站，请在 Cloud Shell 中运行以下命令：

gcloud compute instances stop VM_NAME

删除所有组件

删除虚拟工作站。
删除防火墙规则。

删除项目

In the Google Cloud console, go to the Manage resources page.
Go to Manage resources
In the project list, select the project that you want to delete, and then click Delete.
In the dialog, type the project ID, and then click Shut down to delete the project.

后续步骤

了解如何创建 GPU 加速的虚拟 Windows 工作站。
详细了解 Google Cloud上的 NVIDIA RTX 虚拟工作站。
详细了解 NVIDIA RTX 虚拟工作站技术。
详细了解 HP Anyware 软件。
详细了解 PCoIP 与其他远程桌面软件的区别。