Vertex AI の生成 AI トレーニングの概要

生成 AI は、大量のデータで事前トレーニングされた大規模な ML モデルに依存することがよくあります。これらのモデルは基盤モデルと呼ばれ、さまざまなタスクの基盤として機能します。Vertex AI の生成 AI を使用して基盤モデルをカスタマイズする方法は多数あります。

  • チューニング: チューニングでは、選択したダウンストリーム タスクに関連する特定の例のトレーニング データセットをモデルに提供します。

    • 教師ありチューニング: この手法では、ラベル付けされた例を使用してモデルをファインチューニングします。各例は、推論中に特定の入力に対して選択された出力を示しています。教師ありチューニングは、分類、感情分析、エンティティ抽出、複雑でないコンテンツの要約、ドメイン固有のクエリの生成など、期待される出力が複雑すぎず、明確に定義できるタスクに効果的です。教師あり学習を使用して、テキスト、画像、音声、ドキュメントのデータ型をチューニングできます。
    • 人間からのフィードバックを用いた強化学習(RLHF)チューニング: この方法は、選択したモデル出力がより複雑な場合に適しています。RLHF チューニングは、質問応答、複雑なコンテンツの要約、クリエイティブなコンテンツの生成など、教師ありチューニングでは簡単に区別できない目標に効果的です。
  • 蒸留: 蒸留では、多くの場合、より高性能で大規模な「教師」モデルの動作を模倣するように、小規模な「生徒」モデルをトレーニングします。

  • アダプタモデルのトレーニング: 基盤モデルと連携して動作し、専門的なタスクのパフォーマンスを改善する小規模なアダプタモデル(またはレイヤ)をトレーニングします。多くの場合、元の基盤モデルのパラメータは固定されたままになり、トレーニング中にアダプタの重みのみが更新されます。

  • グラウンディング: トレーニング方法ではありませんが、グラウンディングは生成 AI 出力の信頼性を確保するうえで重要な要素です。グラウンディングでは、モデルの出力を検証可能な情報源に紐付け、コンテンツ捏造の可能性を低減します。多くの場合、推論中に特定のデータソースにアクセスできるようにモデルを設定する必要があります。

次のステップ