Vertex AI 上的 DeepSeek 模型提供全代管無伺服器模型,並以 API 形式提供。如要在 Vertex AI 上使用 DeepSeek 模型,請直接將要求傳送至 Vertex AI API 端點。由於 DeepSeek 模型使用受管理的 API,因此您不必佈建或管理基礎架構。
您可以串流回應,減少使用者感受到的延遲時間。串流回應會使用伺服器推送事件 (SSE) 逐步串流回應。
可用的 DeepSeek 模型
您可以在 Vertex AI 中使用 DeepSeek 提供的下列模型。如要存取 DeepSeek 模型,請前往其 Model Garden 模型資訊卡。
DeepSeek-V3.1
DeepSeek-V3.1 是混合式模型,支援思考模式和非思考模式。與舊版相比,這個升級版在混合思考模式、工具呼叫和思考效率方面都有所提升。
DeepSeek R1 (0528)
DeepSeek R1 (0528) 是 DeepSeek R1 模型的最新版本。 與 DeepSeek-R1 相比,這款模型在推論深度和推論能力方面都有顯著提升。DeepSeek R1 (0528) 擅長處理各種工作,例如: 創意寫作、回答一般問題、編輯和摘要。
注意事項
- 如要確保安全無虞,請將 DeepSeek R1 (0528) 與 Model Armor 整合,篩選 LLM 提示詞和回覆,找出各種安全風險。
使用 DeepSeek 模型
您可以使用 curl 指令,透過下列模型名稱將要求傳送至 Vertex AI 端點:
- 如要使用 DeepSeek-V3.1,請使用
deepseek-v3.1-maas
- 如要使用 DeepSeek R1 (0528),請使用
deepseek-r1-0528-maas
如要瞭解如何對 DeepSeek 模型發出串流和非串流呼叫,請參閱「呼叫開放模型 API」。
DeepSeek 模型支援的區域和配額
如果是 DeepSeek 模型,則模型可用的每個區域都適用配額。配額以每分鐘查詢次數 (QPM) 為單位。
模型 | 區域 | 配額 | 脈絡長度 |
---|---|---|---|
DeepSeek-V3.1 | |||
us-west2 |
|
163,840 | |
DeepSeek R1 (0528) | |||
us-central1 |
|
163,840 |
如要增加任何 Vertex AI 的生成式 AI 配額,可以透過 Google Cloud 控制台申請提高配額。如要進一步瞭解配額,請參閱 Cloud Quotas 總覽。
後續步驟
- 瞭解如何呼叫開放模型 API。