DeepSeek 模型

您可以在 Vertex AI 上使用 DeepSeek 模型做為受管理 API 和自行部署的模型。您可以串流回應,減少使用者感受到的延遲。串流回應會使用伺服器傳送事件 (SSE) 逐步串流回應。

代管 DeepSeek 模型

DeepSeek 模型提供全代管無伺服器模型做為 API。如要在 Vertex AI 上使用 DeepSeek 模型,請直接將要求傳送至 Vertex AI API 端點。以受管理 API 形式使用 DeepSeek 模型時,不必佈建或管理基礎架構。

您可以在 Vertex AI 中使用 DeepSeek 的下列模型。如要存取 DeepSeek 模型,請前往其 Model Garden 模型資訊卡。

DeepSeek-OCR

DeepSeek-OCR 是一種全方位的光學字元辨識 (OCR) 模型,可分析及理解複雜文件。擅長處理困難的 OCR 工作,包括辨識數學公式,以及處理彎曲、旋轉或重疊的文字。

前往 DeepSeek-OCR 模型資訊卡

DeepSeek-V3.2

DeepSeek-V3.2 模型兼具高運算效率,以及卓越的推論和代理程式效能。DeepSeek 的方法是以三項重大技術突破為基礎:DeepSeek Sparse Attention (DSA)、可擴充的強化學習架構,以及大規模的代理程式工作合成管道。

前往 DeepSeek-V3.2 模型資訊卡

DeepSeek-V3.1

DeepSeek-V3.1 是混合式模型,支援思考模式和非思考模式。與舊版相比,這次升級改善了混合思考模式、工具呼叫和思考效率。

前往 DeepSeek-V3.1 模型資訊卡

DeepSeek R1 (0528)

DeepSeek R1 (0528) 是 DeepSeek R1 模型的最新版本。 與 DeepSeek-R1 相比,這款模型在推論深度和推論能力方面都有顯著提升。DeepSeek R1 (0528) 擅長處理各種工作,例如創意寫作、一般問題解答、編輯和摘要。

注意事項

如要確保安全無虞,請將 DeepSeek R1 (0528) 與 Model Armor 整合,篩選 LLM 提示詞和回覆,找出各種安全風險。

前往 DeepSeek R1 (0528) 模型資訊卡

使用 DeepSeek 模型

如果是受管理模型,您可以使用 curl 指令,透過下列模型名稱將要求傳送至 Vertex AI 端點:

  • 如要使用 DeepSeek-OCR,請使用 deepseek-ocr-maas
  • 如要使用 DeepSeek-V3.2,請參閱deepseek-v3.2-maas
  • 如要使用 DeepSeek-V3.1,請使用 deepseek-v3.1-maas
  • 如要使用 DeepSeek R1 (0528),請使用 deepseek-r1-0528-maas

如要瞭解如何對 DeepSeek 模型發出串流和非串流呼叫,請參閱「呼叫開放模型 API」。

如要使用自行部署的 Vertex AI 模型,請按照下列步驟操作:

  1. 前往 Model Garden 控制台
  2. 找出相關的 Vertex AI 模型。
  3. 按一下「啟用」並填寫表單,取得必要的商業用途授權。

如要進一步瞭解如何部署及使用合作夥伴模型,請參閱「 部署合作夥伴模型並提出預測要求 」。

DeepSeek 模型適用區域

DeepSeek 模型適用於下列區域:

型號 區域
DeepSeek-OCR
  • us-central1
    • 輸出內容上限:8,192 個字元
    • 脈絡長度:8,192
DeepSeek-V3.2
  • global
    • 輸出內容上限:65,536
    • 脈絡長度:163,840
DeepSeek-V3.1
  • us-central1
    • 輸出內容上限:32,768 個
    • 脈絡長度:163,840
DeepSeek R1 (0528)
  • us-central1
    • 輸出內容上限:32,768 個
    • 脈絡長度:163,840

後續步驟

瞭解如何呼叫開放模型 API