Google モデル

Gemini Enterprise Agent Platform の Google モデルは、API としてフルマネージド モデルとサーバーレス モデルを提供します。Agent Platform で Google モデルを使用するには、Agent Platform API エンドポイントにリクエストを直接送信します。Google モデルはマネージド API を使用します。インフラストラクチャをプロビジョニング、管理する必要はありません。

レスポンスをストリーミングして、エンドユーザーのレイテンシを軽減できます。回答をストリーミングする際には、サーバー送信イベント (SSE)を使用して回答を段階的にストリーミングします。

Gemma 4 26B A4B IT

Gemma 4 26B A4B IT は、テキストと画像の入力を処理してテキスト出力を生成する Google のマルチモーダル モデルです。

Gemma 4 26B A4B IT モデルカードに移動する

Google モデルを使用する

マネージド モデルの場合は、curl コマンドを使用して、 Gemini Enterprise Agent Platform エンドポイントに次のモデル名を使用してリクエストを送信できます。

  • Gemma 4 26B A4B IT の場合は gemma-4-26b-a4b-it-maas を使用します。

Google モデルにストリーミング呼び出しと非ストリーミング呼び出しを行う方法については、 オープンモデル API を呼び出すをご覧ください。

自己デプロイされた Gemini Enterprise Agent Platform モデルを使用するには:

  1. Model Garden コンソールに移動します。
  2. 関連する Gemini Enterprise Agent Platform モデルを見つけます。
  3. [有効にする] をクリックし、表示されたフォームに記入して必要な商用利用ライセンスを取得します。

パートナー モデルのデプロイと使用の詳細については、 パートナー モデルをデプロイして予測リクエストを行う をご覧ください。

Google モデルのリージョンでの提供状況

Google モデルは次のリージョンで利用できます。

モデル リージョン
Gemma 4 26B A4B IT
  • global
    • 最大出力: 128,000
    • コンテキストの長さ: 262,144

次のステップ

オープンモデル API を呼び出す方法を確認する