RAG を使用してレスポンスをグラウンディングする

グラウンディングは、より信頼性が高く、有用で、事実に基づくモデルのレスポンスを生成するために使用できる手法です。生成 AI モデルのレスポンスをグラウンディングすると、検証可能な情報源に関連付けることができます。通常、グラウンドングを実装するには、関連するソースデータを取得する必要があります。検索拡張生成(RAG)手法を使用することをおすすめします。通常、検索は検索エンジンを使用して行われます。検索エンジンは、ソーステキストのセマンティックな意味が埋め込まれたインデックスを使用します。

また、Vertex AI Search Builder API など、RAG ライフサイクルを実装するサービスとコンポーネント API もあり、組み合わせて構築できます。組み合わせて構築する場合は、次のいずれかのサービスまたは API を使用して RAG ソリューションを実装できます。

  • グラウンディング生成 API: グラウンディングを実装できるほか、検索プロバイダにリンクして RAG のライフサイクル全体を実現できます。
  • ドキュメント レイアウト パーサー: このパーサーは、ドキュメント理解のために Document AI と Gemini の長所を組み合わせたものです。レイアウト パーサーの詳細については、レイアウト パーサーを使用するをご覧ください。
  • Vertex AI ベクトル検索: この検索サービスは高性能で、高品質のベクトル データベースを使用します。
  • グラウンディング チェック API: この API は、RAG の出力を取得した事実と比較し、ユーザーにレスポンスを返す前にすべてのステートメントがグラウンディングされていることを確認します。

Vertex AI RAG Engine を使用してレスポンスをグラウンディングする

Vertex AI RAG Engine を使用してレスポンスをグラウンディングするには、プロンプトを作成する必要があります。手順は次のとおりです。

  1. Google Cloud コンソールで、Vertex AI Studio を使用して [プロンプトを作成] ページに移動します。

    [プロンプトを作成] に移動

  2. [グラウンディング: お客様のデータ] を選択します。

  3. [RAG Engine] のグラウンディング ソースを選択します。

  4. [コーパス] リストからコーパス名を選択します。

  5. [Top-K 類似度] フィールドで、デフォルトの 20 を選択します。

  6. [保存] をクリックします。

次のステップ