Penagihan Vertex AI RAG Engine

Halaman ini menjelaskan harga dan penagihan Mesin RAG Vertex AI berdasarkan komponen Mesin RAG Vertex AI yang Anda gunakan, seperti model, peringkat ulang, dan penyimpanan vektor.

Untuk mengetahui informasi selengkapnya, lihat halaman ringkasan Mesin RAG Vertex AI overview.

Penetapan harga dan penagihan

Tabel ini menjelaskan cara kerja penagihan saat Anda menggunakan komponen RAG.

Komponen Cara kerja penagihan dengan Mesin RAG Vertex AI
Penyerapan data Mesin RAG Vertex AI mendukung penyerapan data dari berbagai sumber data. Misalnya, mengupload file lokal, Cloud Storage, dan Google Drive. Mengakses file di sumber data ini dari Mesin RAG Vertex AI tidak dikenai biaya, tetapi sumber data ini mungkin mengenakan biaya untuk transfer data. Misalnya, biaya keluar data.
Transformasi data (penguraian file)
  • Pengurai default: Gratis.
  • Pengurai LLM: Mesin RAG Vertex AI menggunakan model LLM yang Anda tentukan untuk mengurai file, dan Anda akan melihat serta membayar biaya model LLM langsung dari project Anda.
  • Pengurai tata letak Document AI: Mesin RAG Vertex AI menggunakan pengurai tata letak Document AI yang Anda tentukan untuk memproses file, dan Anda akan melihat serta membayar penggunaan pengurai tata letak Document AI langsung dari project Anda.
Transformasi data (pemecahan file) Mendukung pemecahan ukuran tetap, yang gratis.
Pembuatan embedding Mesin RAG Vertex AI mengatur pembuatan embedding menggunakan model embedding yang Anda tentukan, dan project Anda akan ditagih untuk biaya yang terkait dengan model tersebut.

Untuk mengetahui informasi harga selengkapnya, lihat Biaya pembuatan dan deployment model AI di Vertex AI.

Pengindeksan dan pengambilan data Mesin RAG mendukung dua kategori database vektor untuk penelusuran vektor:
  • Database yang dikelola RAG
  • Database vektor Bring-Your-Own

Database yang dikelola RAG memiliki dua tujuan:
  • Database yang dikelola RAG menyimpan resource RAG, seperti korpus RAG dan file RAG. Konten file dikecualikan.
  • Sesuai pilihan Anda, pengindeksan dan pengambilan embedding untuk penelusuran vektor.

Database yang dikelola RAG menggunakan instance Spanner sebagai backend.

Untuk setiap project Anda, Mesin RAG Vertex AI menyediakan project khusus pelanggan Google Cloud dan mengelola resource yang dikelola RAG yang disimpan di Mesin RAG Vertex AI, sehingga data Anda terisolasi secara fisik.

Jika Anda memilih paket Dasar RagManagedDB atau paket Skala, Mesin RAG Vertex AI akan menyediakan instance Spanner Enterprise Edition di project yang sesuai:

  • Paket dasar: 100 unit pemrosesan dengan pencadangan
  • Paket skala: Mulai dari 1 node (1.000 unit pemrosesan) dan penskalaan otomatis hingga 10 node dengan pencadangan

Jika ada korpus RAG di project Anda yang memilih menggunakan database yang dikelola RAG untuk penelusuran vektor, Anda akan dikenai biaya untuk instance Spanner yang dikelola RAG.

Mesin RAG Vertex AI menampilkan biaya Spanner dari project yang dikelola RAG yang sesuai ke project Anda Google Cloud , sehingga Anda dapat melihat dan membayar biaya instance Spanner.

Untuk mengetahui detail harga Spanner selengkapnya, lihat Harga Spanner.

Peringkat ulang untuk Mesin RAG Vertex AI Alat peringkat berikut didukung setelah pengambilan:
  • Peringkat Ulang LLM: Mesin RAG Vertex AI menggunakan model LLM yang Anda tentukan untuk memberi peringkat ulang hasil pengambilan, dan Anda akan melihat serta membayar biaya model LLM langsung dari project Anda.
  • API peringkat Agent Search: Mesin RAG Vertex AI menggunakan API peringkat Agent Search untuk memberi peringkat ulang hasil pengambilan, dan Anda akan melihat serta membayar API Peringkat langsung dari project Anda.

Menghapus Mesin RAG Vertex AI

Contoh kode berikut menunjukkan cara menghapus Mesin RAG Vertex AI untuk Google Cloud konsol, Python, dan REST:

  • Parameter API dan contoh kode versi 1 (v1) parameters and code samples.

  • Parameter API v1beta1 dan contoh kode.

Langkah berikutnya