MiniMax モデル

Vertex AI の MiniMax モデルは、API としてフルマネージドモデルとサーバーレスモデルを提供します。Vertex AI で MiniMax モデルを使用するには、Vertex AI API エンドポイントにリクエストを直接送信します。MiniMax モデルはマネージド API を使用します。インフラストラクチャのプロビジョニングや管理は不要です。

レスポンスをストリーミングして、エンドユーザーのレイテンシを軽減できます。回答をストリーミングする際には、サーバー送信イベント（SSE）を使用して回答を段階的にストリーミングします。

利用可能な MiniMax モデル

Vertex AI で使用できる MiniMax のモデルは次のとおりです。MiniMax モデルにアクセスするには、Model Garden のモデルカードに移動します。

MiniMax M2

MiniMax M2 は、エージェント関連のタスクとコード関連のタスク向けに設計された MiniMax のモデルです。エンドツーエンドの開発ワークフロー向けに構築されており、複雑なツール呼び出しタスクの計画と実行に優れた機能があります。このモデルは、パフォーマンス、費用、推論速度のバランスを取るように最適化されています。

MiniMax M2 モデルカードに移動する