本頁將概略介紹在 Vertex AI 上訓練及使用自有機器學習 (ML) 模型的工作流程。Vertex AI 提供各種訓練方法,從全自動到全自訂,可滿足您的需求。
- AutoML:運用 Google 的自動化機器學習功能,輕鬆建構高品質模型。
- Vertex AI 無伺服器訓練:在全代管的隨選環境中執行自訂訓練程式碼,不必擔心基礎架構。
- Vertex AI 訓練叢集:在專屬加速器叢集上執行大規模高效能訓練工作,這些加速器叢集專供您使用。
- Vertex AI 上的 Ray:透過代管服務上的開放原始碼 Ray 架構,擴充 Python 應用程式和機器學習工作負載。
如需相關說明以決定要使用哪種方法,請參閱「選擇訓練方法」。
AutoML
Vertex AI 的 AutoML 可讓您根據提供的訓練資料,建構無程式碼的機器學習模型。AutoML 可自動執行資料準備、模型選取、超參數調整和部署等工作,適用於各種資料類型和預測工作,讓更多使用者都能輕鬆運用機器學習。
您可以使用 AutoML 建構的模型類型
您可以建立的模型類型會因您擁有的資料類型而異。Vertex AI 提供下列資料類型和模型目標的 AutoML 解決方案:
| 資料類型 | 支援的目標 |
|---|---|
| 圖片資料 | 分類、物件偵測。 |
| 表格資料 | 分類/迴歸、預測。 |
如要進一步瞭解 AutoML,請參閱「AutoML 訓練總覽」。
在 Vertex AI 中執行自訂訓練程式碼
如果 AutoML 無法滿足您的需求,您可以提供自己的訓練程式碼,並在 Vertex AI 的代管基礎架構上執行。您可以完全掌控及彈性調整模型架構和訓練邏輯,並使用任何您選擇的 ML 框架。
Vertex AI 提供兩種主要模式,可執行自訂訓練程式碼:無伺服器隨選環境,或專屬預留叢集。
Vertex AI 無伺服器訓練
無伺服器訓練是全代管服務,可讓您執行自訂訓練應用程式,不必佈建或管理任何基礎架構。將程式碼封裝在容器中,定義機器規格 (包括 CPU 和 GPU),然後以 CustomJob 形式提交。
Vertex AI 會處理其餘事項:
- 在工作期間內佈建運算資源。
- 執行訓練程式碼。
- 工作完成後刪除資源。
這種隨選即用模式採用隨用隨付計費方式,非常適合用於實驗、快速原型設計,以及不需要保證即時容量的正式工作。
詳情請參閱「建立無伺服器訓練自訂作業」。
Vertex AI 訓練叢集
如要進行大規模、高效能和重要業務訓練,可以預留專屬的加速器叢集。這可確保容量並消除佇列,確保工作立即啟動。
雖然您可專門使用這些資源,但 Vertex AI 仍會處理叢集管理作業的運作負荷,包括硬體維護和 OS 修補。這種「代管伺服器」方法可讓您享有專用叢集的強大功能,同時免除管理複雜作業的負擔。
Ray on Vertex AI
透過 Vertex AI 上的 Ray 服務,您可以在 Vertex AI 平台內直接使用開放原始碼的 Ray 架構,擴充 AI 和 Python 應用程式。Ray 的設計主旨是為 ML 工作流程提供分散式運算和並行處理的基礎架構。
Ray on Vertex AI 提供代管環境,可使用 Ray 架構執行分散式應用程式,並提供擴充能力,以及與 Google Cloud 服務整合。
如要進一步瞭解 Vertex AI 上的 Ray,請參閱 Vertex AI 上的 Ray 總覽。