このページでは、使用する Gemini Enterprise Agent Platform 上の RAG Engine コンポーネント(モデル、再ランキング、ベクトル ストレージなど)に基づく、Gemini Enterprise Agent Platform 上の RAG Engine の料金と請求について説明します。
詳細については、Gemini Enterprise Agent Platform 上の RAG Engine 概要のページをご覧ください。
料金と課金
次の表では、RAG コンポーネントを使用した場合の課金の仕組みについて説明します。
| コンポーネント | RAG Engine での課金の仕組み |
|---|---|
| データの取り込み | RAG Engine は、さまざまなデータソースからのデータ取り込みをサポートしています。たとえば、ローカル ファイルのアップロード、 Cloud Storage、Google ドライブが該当します。RAG Engine からこれらのデータ ソース内のファイルにアクセスするのは無料ですが、これらのデータ ソースではデータ転送に料金が発生する場合があります。たとえば、データの下り(外向き)費用などです。 コスト |
| データ 変換(ファイルの解析) |
|
| データ変換(ファイル チャンク化) | 固定サイズのチャンク化をサポートします(無料)。 |
| エンベディングの生成 |
RAG Engine は、指定したエンベディング モデルを使用してエンベディング 生成をオーケストレートします。プロジェクトには、そのモデルに関連する費用が請求されます。 料金の詳細については、Gemini Enterprise Agent Platform での AI モデルの構築と デプロイの費用をご覧ください。 |
| データのインデックス作成と取得 |
RAG Engine は、ベクトル 検索用に次の 2 つのカテゴリのベクトル データベースをサポートしています。
RAG が管理するデータベースには次の 2 つの目的があります。
RAG が管理するデータベースは、バックエンドとして Spanner インスタンスを使用します。 RAG Engine は、各プロジェクトに対して顧客固有の Google Cloud プロジェクトをプロビジョニングし、RAG Engine に保存されている RAG が管理するリソースを管理して、データが物理的に分離されるようにします。
プロジェクト内の RAG コーパスがベクトル検索に RAG が管理する データベースを使用する場合、RAG が管理する Spanner インスタンスに対して課金されます。 RAG Engine は、対応する RAG マネージド プロジェクトから Google Cloudプロジェクトに Spanner の費用を表示します。これにより、Spanner インスタンス の費用を確認して支払うことが可能です。 Spanner の料金の詳細については、Spanner の料金をご覧ください。 |
| Gemini Enterprise Agent Platform 上の RAG Engine の 再ランキング |
取得後にサポートされるランキング ツールは次のとおりです。
|
RAG Engine を削除
次のコードサンプルは、 コンソール、Python、REST で RAG Engine を削除する方法を示しています。 Google Cloud
次のステップ
Vertex AI SDK を使用して Gemini Enterprise Agent Platform 上の RAG Engine タスクを実行する方法について、Python の RAG クイックスタートで確認する。
グラウンディングについて、グラウンディング の概要で確認する。
RAG からのレスポンスの詳細については、検索と生成 RAG Engineの出力をご覧ください。
RAG アーキテクチャについて確認するには: