本頁面由 Cloud Translation API 翻譯而成。

Qwen 模型

Vertex AI 上的 Qwen 模型提供全代管的無伺服器模型，並以 API 形式提供。如要在 Vertex AI 上使用 Qwen 模型，請直接將要求傳送至 Vertex AI API 端點。由於 Qwen 模型使用受管理的 API，因此不需要佈建或管理基礎架構。

您可以串流回應，減少使用者感受到的延遲時間。串流回應會使用伺服器推送事件 (SSE) 逐步串流回應。

可用的 Qwen 模型

您可以在 Vertex AI 中使用 Qwen 的下列模型。如要存取 Qwen 模型，請前往 Model Garden 的模型資訊卡。

Qwen3-Next-80B Instruct

Qwen3-Next-80B Instruct 是 Qwen3-Next 系列的語言模型。這項模型專門用來執行特定指令，以及處理非常長的文字。Gemini 1.5 Pro 採用名為「專家混合」(MoE) 的智慧設計，可啟用部分可用參數來處理資訊，因此執行速度比其他同等大小的模型更快，也更具成本效益。

Instruct 版本經過調整，可在即時通訊和代理程式應用程式中提供可靠的直接回覆，且具備大型內容視窗，可將整個對話或大型文件保留在記憶體中。

前往 Qwen3-Next-80B Instruct 模型資訊卡

Qwen3-Next-80B Thinking

Qwen3-Next-80B Thinking 是 Qwen3-Next 系列的語言模型。專門用於解決複雜問題和深入推理。「思考」模式會顯示逐步推論過程和最終答案，因此非常適合需要透明邏輯的任務，例如數學證明、複雜的程式碼偵錯，或多步驟的代理規劃。

前往 Qwen3-Next-80B Thinking 模型資訊卡

Qwen3 Coder (Qwen3 Coder)

Qwen3 Coder (Qwen3 Coder) 是專為進階軟體開發工作設計的大型開放權重模型。這款模型的主要特色是脈絡窗口很大，因此能全面處理及瞭解大型程式碼庫。

前往 Qwen3 Coder 模型資訊卡

Qwen3 235B (Qwen3 235B)

Qwen3 235B (Qwen3 235B) 是大型模型，具有 2350 億個參數。這項模型以「混合思考」功能為特色，可讓使用者在有條不紊、逐步「思考」模式之間動態切換，以處理數學推理和編碼等複雜工作，以及快速「非思考」模式，以進行一般用途的對話。由於脈絡窗口較大，因此適合需要深入推理和理解長篇內容的用途。

前往 Qwen3 235B 模型資訊卡

使用 Qwen 模型

如要瞭解如何對 Qwen 模型發出串流和非串流呼叫，請參閱「呼叫開放模型 API」。

後續步驟

瞭解如何呼叫開放模型 API。