DeepSeek 模型

Vertex AI 上的 DeepSeek 模型以 API 形式提供全托管式无服务器模型。如需在 Vertex AI 上使用 DeepSeek 模型，请直接向 Vertex AI API 端点发送请求。由于 DeepSeek 模型使用托管式 API，因此无需预配或管理基础设施。

您可以流式传输回答，以降低最终用户对延迟时间的感知度。流式回答使用服务器发送的事件 (SSE) 来逐步流式传输回答。

可用的 DeepSeek 模型

DeepSeek 提供了以下模型，可在 Vertex AI 中使用。如需访问 DeepSeek 模型，请前往其 Model Garden 模型卡片。

DeepSeek-OCR 是一款全面的光学字符识别 (OCR) 模型，可分析和理解复杂的文档。它擅长处理具有挑战性的 OCR 任务，包括识别数学公式和处理弯曲、旋转或重叠的文本。

DeepSeek-V3.2 是一款兼具高计算效率和出色推理能力及代理性能的模型。DeepSeek 的方法基于三项关键技术突破：DeepSeek 稀疏注意力 (DSA)、可扩缩的强化学习框架和大规模智能体任务合成流水线。

DeepSeek-V3.1 是一种混合模型，可同时支持思考模式和非思考模式。与之前的版本相比，此升级在混合思考模式、工具调用和思考效率方面有所改进。

DeepSeek R1 (0528) 是最新版本的 DeepSeek R1 模型。与 DeepSeek-R1 相比，其推理能力有了显著提升。DeepSeek R1 (0528) 擅长处理各种任务，例如创意写作、一般问答、编辑和总结。

如需获得可用于生产环境的安全保障，请将 DeepSeek R1 (0528) 与 Model Armor 集成，后者可过滤 LLM 提示和回答中的各种安全和保障风险。

您可以使用 curl 命令通过以下模型名称向 Vertex AI 端点发送请求：

如需了解如何对 DeepSeek 模型进行流式调用和非流式调用，请参阅调用开放模型 API。

对于 DeepSeek 模型，提供该模型的每个区域都有相应的配额。配额以每分钟查询次数 (QPM) 来指定。

型号	区域	上下文长度
DeepSeek-OCR
DeepSeek-OCR	`us-central1`	8192
DeepSeek-V3.2
DeepSeek-V3.2	`global`	163,840
DeepSeek-V3.1
DeepSeek-V3.1	`us-west2`	163,840
DeepSeek R1 (0528)
DeepSeek R1 (0528)	`us-central1`	163,840

如果要增加 Vertex AI 上的生成式 AI 的任何配额，您可以使用 Google Cloud 控制台申请增加配额。如需详细了解配额，请参阅 Cloud 配额概览。