Gemma は、軽量の生成 AI(AI)オープンモデルのセットです。Gemma モデルは、アプリケーション内、ハードウェア、モバイル デバイス、ホスト型サービスで実行できます。また、これらのモデルをチューニング技術でカスタマイズし、デベロッパーやユーザーにとって重要なタスクを実行することもできます。Gemma モデルは Gemini モデルに基づいており、AI 開発コミュニティの拡大とさらなる発展を目的としています。
ファインチューニングを行うと、特定のタスクにおけるモデルのパフォーマンスを改善できます。Gemma モデル ファミリーのモデルはオープン ウェイトであるため、任意の AI フレームワークと Vertex AI SDK を使用してチューニングできます。Model Garden の Gemma モデルカードにあるリンクを使用して、ノートブックの例を開き Gemma モデルをファインチューニングできます。
Gemini Enterprise Agent Platform で使用できる Gemma モデルは次のとおりです。Gemma モデルの詳細とテストについては、Model Garden のモデルカードをご覧ください。
| モデル名 | ユースケース | Model Garden のモデルカード |
|---|---|---|
| Gemma 4 | マルチモーダル入力に対応し、テキスト、画像、音声の入力を処理して、テキスト出力を生成します。 | Gemma 4 モデルカードに移動する |
| TranslateGemma | 55 言語の翻訳タスクを処理するように設計された、軽量のオープン翻訳モデルのファミリー。 | TranslateGemma モデルカードに移動する |
| FunctionGemma | 独自の特殊な関数呼び出しモデルを作成するための基盤として構築された軽量のオープンモデル。さらにファインチューニングすることで、高いパフォーマンスを発揮するように設計されています。 | FunctionGemma モデルカードに移動する |
| Gemma 3n | マルチモーダル入力に対応し、テキスト、画像、音声の入力を処理して、テキスト出力を生成します。 | Gemma 3n モデルカードに移動 |
| Gemma 3 | 質問応答、要約、推論など、テキスト生成タスクや画像理解タスクに最適です。 | Gemma 3 モデルカードに移動する |
| Gemma 2 | テキストの生成、要約、抽出に最適。 | Gemma 2 モデルカードに移動する |
| Gemma | テキストの生成、要約、抽出に最適。 | Gemma モデルカードに移動する |
| CodeGemma | コードの生成と補完に最適。 | CodeGemma モデルカードに移動 |
| PaliGemma 2 | 画像のキャプション付けや、視覚的な質問と回答のタスクに最適。 | PaliGemma 2 モデルカードに移動する |
| PaliGemma | 画像のキャプション付けや、視覚的な質問と回答のタスクに最適。 | PaliGemma モデルカードに移動 |
| ShieldGemma 2 | 合成画像と自然画像の安全性をチェックして、堅牢なデータセットとモデルの構築を支援します。 | ShieldGemma 2 モデルカードに移動する |
| TxGemma | 分類、回帰、生成などの治療予測タスクや、推論タスクに最適です。 | TxGemma モデルカードに移動する |
| MedGemma | 医療のテキストと画像の理解におけるパフォーマンスを重視してトレーニングされた Gemma 3 バリアント。 | MedGemma モデルカードに移動する |
| MedSigLIP | 医療画像とテキストを共通のエンベディング空間にエンコードするようにトレーニングされた SigLIP バリアント。 | MedSigLIP モデルカードに移動する |
| T5Gemma | 質問応答、要約、推論など、さまざまな生成タスクに適しています。 | T5Gemma モデルカードに移動する |
| T5Gemma 2 | 質問応答、要約、推論など、さまざまな生成タスクに適しています。 | T5Gemma 2 モデルカードに移動する |
Gemma を使用できる場所は次のとおりです。
Gemini Enterprise Agent Platform で Gemma を使用する
Gemini Enterprise Agent Platform は、社内の MLOps の専門知識がなくても、ML プロジェクトを迅速に構築してスケーリングできるマネージド プラットフォームを提供します。Gemini Enterprise Agent Platform は、Gemma モデルを提供するダウンストリーム アプリケーションとして使用できます。たとえば、Gemma の Keras 実装から重みを移植できます。次に、Agent Platform を使用してそのバージョンの Gemma を提供し、予測を取得できます。エンドツーエンドの MLOps 機能、付加価値のある ML 機能、開発の合理化に役立つサーバーレス エクスペリエンスが必要な場合は、Gemini Enterprise Agent Platform を使用することをおすすめします。
Gemma の使用を開始するには、次のノートブックをご覧ください。
Axolotl を使用して Gemma 3 をファインチューニングし、Vertex から Gemini Enterprise Agent Platform にデプロイする
PEFT を使用して Gemma 2 をファインチューニングし、Vertex から Gemini Enterprise Agent Platform にデプロイする
PEFT を使用して Gemma をファインチューニングし、Vertex から Gemini Enterprise Agent Platform にデプロイする
PEFT を使用して Gemma をファインチューニングし、Huggingface から Gemini Enterprise Agent Platform にデプロイする
KerasNLP を使用して Gemma をファインチューニングしてから Gemini Enterprise Agent Platform にデプロイする
Agent Platform の Ray を使用して Gemma をファインチューニングし、Gemini Enterprise Agent Platform にデプロイする
他の Google Cloud プロダクトで Gemma を使用する
Gemma は、Google Kubernetes Engine や Dataflow などの他の Google Cloud プロダクトで使用できます。
GKE で Gemma を使用する
Google Kubernetes Engine(GKE)は、スケーラビリティ、セキュリティ、復元力、費用対効果に優れたマネージド Kubernetes 向けの Google Cloud ソリューションです。既存の Kubernetes への投資があり、組織内に独自の MLOps 専門知識が存在しているか、独自のセキュリティ、データ パイプライン、リソース管理要件に従って複雑な AI / ML ワークロードをきめ細かく制御する必要がある場合は、このオプションをおすすめします。詳細については、GKE ドキュメントの次のチュートリアルをご覧ください。
Dataflow で Gemma を使用する
Dataflow で Gemma モデルを使用して感情分析を行うことができます。Dataflow を使用して、Gemma モデルを使用する推論パイプラインを実行します。詳細については、Gemma オープンモデルを使用して推論パイプラインを実行するをご覧ください。
Colab で Gemma を使用する
Colaboratory で Gemma を使用して Gemma ソリューションを作成できます。Colab では、PyTorch や JAX などのフレームワーク オプションとともに Gemma を使用できます。詳しくは、次をご覧ください。
- Keras を使用した Gemma を使ってみる
- PyTorch を使用した Gemma を使ってみる
- Keras を使用した Gemma の基本的なチューニング。
- Keras を使用した Gemma による分散チューニング。
Gemma モデルのサイズと機能
Gemma モデルには複数のサイズがあり、利用可能なコンピューティング リソース、必要な機能、実行場所に基づいて生成 AI ソリューションを構築できます。各モデルには、チューニング済みバージョンとまだチューニングされていないバージョンがあります。
事前トレーニング済み - このバージョンのモデルは、Gemma コアデータのトレーニング セット以外の特定のタスクや指示ではトレーニングされていません。チューニングを行わずにこのモデルを使用することはおすすめしません。
指示のチューニング済み - このバージョンのモデルは、基本的な chat bot と同様に会話に参加できるように、人間の言語のやり取りでトレーニングされています。
ミックス ファインチューニング済み - このバージョンのモデルは、学術データセットの組み合わせでファインチューニングされており、自然言語のプロンプトを受け付けます。
パラメータ サイズが小さいほど、リソース要件が少なく、デプロイの柔軟性が高くなります。
| モデル名 | パラメータ サイズ | 入力 | 出力 | チューニング済みバージョン | 目的のプラットフォーム |
|---|---|---|---|---|---|
| Gemma 4 | |||||
| Gemma 4 31B | 310 億のパラメータ | テキストと画像 | テキスト |
|
大規模なサーバーまたはサーバー クラスタ |
| Gemma 4 26B A4B | 260 億のパラメータ、40 億のアクティブ パラメータ | テキストと画像 | テキスト |
|
ハイエンド デスクトップ パソコンとサーバー |
| Gemma 4 E4B | 40 億の有効パラメータ | テキスト、画像、音声 | テキスト |
|
モバイル デバイスとノートパソコン |
| Gemma 4 E2B | 20 億の有効なパラメータ | テキスト、画像、音声 | テキスト |
|
モバイル デバイスとノートパソコン |
| Gemma 3n | |||||
| Gemma 3n E4B | 40 億の有効パラメータ | テキスト、画像、音声 | テキスト |
|
モバイル デバイスとノートパソコン |
| Gemma 3n E2B | 20 億の有効なパラメータ | テキスト、画像、音声 | テキスト |
|
モバイル デバイスとノートパソコン |
| Gemma 3 | |||||
| Gemma 3 27B | 270 億 | テキストと画像 | テキスト |
|
大規模なサーバーまたはサーバー クラスタ |
| Gemma 3 12B | 120 億 | テキストと画像 | テキスト |
|
ハイエンド デスクトップ パソコンとサーバー |
| Gemma 3 4B | 40 億 | テキストと画像 | テキスト |
|
デスクトップ コンピュータと小規模サーバー |
| Gemma 3 1B | 10 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| Gemma 2 | |||||
| Gemma 2 27B | 270 億 | テキスト | テキスト |
|
大規模なサーバーまたはサーバー クラスタ |
| Gemma 2 9B | 90 億人の | テキスト | テキスト |
|
ハイエンド デスクトップ パソコンとサーバー |
| Gemma 2 2B | 20 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| Gemma | |||||
| Gemma 7B | 70 億 | テキスト | テキスト |
|
デスクトップ コンピュータと小規模サーバー |
| Gemma 2B | 22 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| CodeGemma | |||||
| CodeGemma 7B | 70 億 | テキスト | テキスト |
|
デスクトップ コンピュータと小規模サーバー |
| CodeGemma 2B | 20 億 | テキスト | テキスト |
|
デスクトップ コンピュータと小規模サーバー |
| PaliGemma 2 | |||||
| PaliGemma 28B | 280 億 | テキストと画像 | テキスト |
|
大規模なサーバーまたはサーバー クラスタ |
| PaliGemma 10B | 100 億 | テキストと画像 | テキスト |
|
ハイエンド デスクトップ パソコンとサーバー |
| PaliGemma 3B | 30 億 | テキストと画像 | テキスト |
|
デスクトップ コンピュータと小規模サーバー |
| PaliGemma | |||||
| PaliGemma 3B | 30 億 | テキストと画像 | テキスト |
|
デスクトップ コンピュータと小規模サーバー |
| ShieldGemma 2 | |||||
| ShieldGemma 2 | 40 億 | テキストと画像 | テキスト |
|
デスクトップ コンピュータと小規模サーバー |
| TxGemma | |||||
| TxGemma 27B | 270 億 | テキスト | テキスト |
|
大規模なサーバーまたはサーバー クラスタ |
| TxGemma 9B | 90 億 | テキスト | テキスト |
|
ハイエンド デスクトップ パソコンとサーバー |
| TxGemma 2B | 20 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| MedGemma | |||||
| MedGemma 27B | 270 億 | テキストと画像 | テキスト |
|
大規模なサーバーまたはサーバー クラスタ |
| MedGemma 4B | 40 億 | テキストと画像 | テキスト |
|
デスクトップ コンピュータと小規模サーバー |
| MedSigLIP | |||||
| MedSigLIP | 8 億 | テキストと画像 | 埋め込み |
|
モバイル デバイスとノートパソコン |
| T5Gemma | |||||
| T5Gemma 9B-9B | 180 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| T5Gemma 9B-2B | 110 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| T5Gemma 2B-2B | 40 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| T5Gemma XL-XL | 40 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| T5Gemma M-L | 20 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| T5Gemma L-L | 10 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| T5Gemma B-B | 6 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
| T5Gemma S-S | 3 億 | テキスト | テキスト |
|
モバイル デバイスとノートパソコン |
Gemma は、Google の専用 v5e TPU ハードウェアと NVIDIA の L4(G2 Standard)、A100(A2 Standard)、H100(A3 High)GPU ハードウェアを使用してテストされています。
次のステップ
- Gemma のドキュメントを確認する。