MiniMax 模型

您可以在 Vertex AI 上使用 MiniMax 模型做為受管理 API 和自行部署的模型。您可以串流回應,減少使用者感受到的延遲。串流回應會使用伺服器傳送事件 (SSE) 逐步串流回應。

代管 MiniMax 模型

MiniMax 模型提供全代管無伺服器模型做為 API。如要在 Vertex AI 上使用 MiniMax 模型,請直接將要求傳送至 Vertex AI API 端點。以受管理 API 形式使用 MiniMax 模型時,不需要佈建或管理基礎架構。

MiniMax 提供下列模型,可在 Vertex AI 中使用。如要存取 MiniMax 模型,請前往 Model Garden 的模型資訊卡。

MiniMax M2

MiniMax M2 是 MiniMax 的模型,專為代理程式和程式碼相關工作而設計。這款模型專為端對端開發工作流程而建,在規劃及執行複雜的工具呼叫工作方面表現出色。這個模型經過最佳化,可在效能、成本和推論速度之間取得平衡。

前往 MiniMax M2 模型卡片

使用 MiniMax 模型

如果是受管理模型,您可以使用 curl 指令,透過下列模型名稱將要求傳送至 Vertex AI 端點:

  • 如果是 MiniMax M2,請使用 minimax-m2-maas

如要瞭解如何對 MiniMax 模型發出串流和非串流呼叫,請參閱「呼叫開放模型 API」。

如要使用自行部署的 Vertex AI 模型,請按照下列步驟操作:

  1. 前往 Model Garden 控制台
  2. 找出相關的 Vertex AI 模型。
  3. 按一下「啟用」並填寫表單,取得必要的商業用途授權。

如要進一步瞭解如何部署及使用合作夥伴模型,請參閱「 部署合作夥伴模型並提出預測要求 」。

MiniMax 模型支援的區域

MiniMax 模型適用於下列區域:

型號 區域
MiniMax M2
  • global
    • 輸出內容上限:196,608
    • 脈絡長度:196,608

後續步驟

瞭解如何呼叫開放模型 API