Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Enterprise Agent Platform での RAG Engine の課金

このページでは、使用する Gemini Enterprise Agent Platform 上の RAG Engine コンポーネント（モデル、再ランキング、ベクトルストレージなど）に基づく、Gemini Enterprise Agent Platform 上の RAG Engine の料金と請求について説明します。

詳細については、Gemini Enterprise Agent Platform 上の RAG Engine 概要のページをご覧ください。

料金と課金

次の表では、RAG コンポーネントを使用した場合の課金の仕組みについて説明します。

コンポーネント	RAG Engine での課金の仕組み
データの取り込み	RAG Engine は、さまざまなデータソースからのデータ取り込みをサポートしています。たとえば、ローカルファイルのアップロード、 Cloud Storage、Google ドライブが該当します。RAG Engine からこれらのデータソース内のファイルにアクセスするのは無料ですが、これらのデータソースではデータ転送に料金が発生する場合があります。たとえば、データの下り（外向き）費用などです。コスト
データ変換（ファイルの解析）	デフォルトパーサー: 無料。 LLM パーサー: RAG Engine は、指定した LLM モデルを使用してファイルを解析します。LLM モデルの費用はプロジェクトから直接確認して支払うことができます。 Document AI layout parser: RAG Engine は、指定した Document AI レイアウトパーサーを使用してファイルを処理します。 Document AI レイアウトパーサーの使用状況はプロジェクトから直接確認でき、料金も直接お支払いいただきます。
データ変換（ファイルチャンク化）	固定サイズのチャンク化をサポートします（無料）。
エンベディングの生成	RAG Engine は、指定したエンベディングモデルを使用してエンベディング生成をオーケストレートします。プロジェクトには、そのモデルに関連する費用が請求されます。料金の詳細については、Gemini Enterprise Agent Platform での AI モデルの構築とデプロイの費用をご覧ください。
データのインデックス作成と取得	注: Gemini Enterprise Agent Platform 上の RAG Engine は、データのインデックス作成と取得オペレーションのバックエンドとして Spanner を使用します。Spanner を使用すると、関連する課金が発生します。詳細については、Spanner の料金をご覧ください。 RAG Engine は、ベクトル検索用に次の 2 つのカテゴリのベクトルデータベースをサポートしています。 RAG が管理するデータベースお客様所有のベクトルデータベース RAG が管理するデータベースには次の 2 つの目的があります。 RAG が管理するデータベースには、RAG コーパスや RAG ファイルなどの RAG リソースが保存されます。ファイルの内容は除外されます。ベクトル検索用のエンベディングのインデックス登録と取得。 RAG が管理するデータベースは、バックエンドとして Spanner インスタンスを使用します。 RAG Engine は、各プロジェクトに対して顧客固有の Google Cloud プロジェクトをプロビジョニングし、RAG Engine に保存されている RAG が管理するリソースを管理して、データが物理的に分離されるようにします。 `RagManagedDB` ベーシックティアまたはスケールティアを選択すると、RAG Engine は対応するプロジェクトに Spanner Enterprise エディションのインスタンスをプロビジョニングします。ベーシックティア: バックアップ付きの 100 処理ユニットスケールティア: 1 ノード（1,000 処理ユニット）から始まり、バックアップ付きの最大 10 ノードまで自動スケーリングプロジェクト内の RAG コーパスがベクトル検索に RAG が管理するデータベースを使用する場合、RAG が管理する Spanner インスタンスに対して課金されます。 RAG Engine は、対応する RAG マネージドプロジェクトから Google Cloudプロジェクトに Spanner の費用を表示します。これにより、Spanner インスタンスの費用を確認して支払うことが可能です。 Spanner の料金の詳細については、Spanner の料金をご覧ください。
Gemini Enterprise Agent Platform 上の RAG Engine の再ランキング	取得後にサポートされるランキングツールは次のとおりです。 LLM 再ランキングツール: RAG Engine は、指定した LLM モデルを使用して検索結果を再ランキングします。 LLM モデルの費用はプロジェクトから直接確認して支払うことになります。 Agent Search Ranking API: RAG Engine は、 Agent Search Ranking API を使用して検索結果を再ランキングします。 Ranking API はプロジェクトから直接確認して支払うことが可能です。

RAG Engine を削除

次のコードサンプルは、コンソール、Python、REST で RAG Engine を削除する方法を示しています。 Google Cloud

バージョン 1（v1）API のパラメータとコードサンプル。
v1beta1 API パラメータとコードサンプル。

次のステップ

Vertex AI SDK を使用して Gemini Enterprise Agent Platform 上の RAG Engine タスクを実行する方法について、Python の RAG クイックスタートで確認する。
グラウンディングについて、グラウンディングの概要で確認する。
RAG からのレスポンスの詳細については、検索と生成 RAG Engineの出力をご覧ください。
RAG アーキテクチャについて確認するには:
- Agent Platform とベクトル検索を使用した RAG 対応生成 AI アプリケーション用インフラストラクチャ
- Agent Platform と AlloyDB for PostgreSQL を使用した RAG 対応生成 AI アプリケーション用インフラストラクチャ。