DeepSeek 模型

Vertex AI 上的 DeepSeek 模型以 API 形式提供全托管式无服务器模型。如需在 Vertex AI 上使用 DeepSeek 模型,请直接向 Vertex AI API 端点发送请求。由于 DeepSeek 模型使用托管式 API,因此无需预配或管理基础设施。

您可以流式传输回答,以降低最终用户对延迟时间的感知度。流式回答使用服务器发送的事件 (SSE) 来逐步流式传输回答。

可用的 DeepSeek 模型

DeepSeek 提供了以下模型,可在 Vertex AI 中使用。如需访问 DeepSeek 模型,请前往其 Model Garden 模型卡片。

DeepSeek-V3.1

DeepSeek-V3.1 是一种混合模型,可同时支持思考模式和非思考模式。与之前的版本相比,此升级在混合思考模式、工具调用和思考效率方面有所改进。

前往 DeepSeek-V3.1 模型卡片

DeepSeek R1 (0528)

DeepSeek R1 (0528) 是最新版本的 DeepSeek R1 模型。 与 DeepSeek-R1 相比,其推理能力有了显著提升。DeepSeek R1 (0528) 擅长处理各种任务,例如创意写作、一般问答、编辑和总结。

注意事项

  • 如需获得可用于生产环境的安全保障,请将 DeepSeek R1 (0528) 与 Model Armor 集成,后者可过滤 LLM 提示和回答中的各种安全和保障风险。

前往 DeepSeek R1 (0528) 模型卡片

使用 DeepSeek 模型

您可以使用 curl 命令通过以下模型名称向 Vertex AI 端点发送请求:

  • 对于 DeepSeek-V3.1,请使用 deepseek-v3.1-maas
  • 对于 DeepSeek R1 (0528),请使用 deepseek-r1-0528-maas

如需了解如何对 DeepSeek 模型进行流式调用和非流式调用,请参阅调用开放模型 API

DeepSeek 模型区域可用性和配额

对于 DeepSeek 模型,提供该模型的每个区域都有相应的配额。配额以每分钟查询次数 (QPM) 来指定。

型号 区域 配额 上下文长度
DeepSeek-V3.1
us-west2
163,840
DeepSeek R1 (0528)
us-central1
163,840

如果要增加 Vertex AI 上的生成式 AI 的任何配额,您可以使用 Google Cloud 控制台申请增加配额。如需详细了解配额,请参阅 Cloud 配额概览

后续步骤