Halaman ini menjelaskan harga dan penagihan Mesin RAG Vertex AI berdasarkan komponen Mesin RAG Vertex AI yang Anda gunakan, seperti model, peringkat ulang, dan penyimpanan vektor.
Untuk mengetahui informasi selengkapnya, lihat halaman ringkasan Mesin RAG Vertex AI overview.
Penetapan harga dan penagihan
Tabel ini menjelaskan cara kerja penagihan saat Anda menggunakan komponen RAG.
| Komponen | Cara kerja penagihan dengan Mesin RAG Vertex AI |
|---|---|
| Penyerapan data | Mesin RAG Vertex AI mendukung penyerapan data dari berbagai sumber data. Misalnya, mengupload file lokal, Cloud Storage, dan Google Drive. Mengakses file di sumber data ini dari Mesin RAG Vertex AI tidak dikenai biaya, tetapi sumber data ini mungkin mengenakan biaya untuk transfer data. Misalnya, biaya keluar data. |
| Transformasi data (penguraian file) |
|
| Transformasi data (pemecahan file) | Mendukung pemecahan ukuran tetap, yang gratis. |
| Pembuatan embedding | Mesin RAG Vertex AI mengatur pembuatan embedding menggunakan model embedding yang Anda tentukan, dan project Anda akan ditagih untuk biaya yang terkait dengan model tersebut. Untuk mengetahui informasi harga selengkapnya, lihat Biaya pembuatan dan deployment model AI di Vertex AI. |
| Pengindeksan dan pengambilan data |
Mesin RAG mendukung dua kategori database vektor untuk penelusuran vektor:
Database yang dikelola RAG memiliki dua tujuan:
Database yang dikelola RAG menggunakan instance Spanner sebagai backend. Untuk setiap project Anda, Mesin RAG Vertex AI menyediakan project khusus pelanggan Google Cloud dan mengelola resource yang dikelola RAG yang disimpan di Mesin RAG Vertex AI, sehingga data Anda terisolasi secara fisik. Jika Anda memilih paket Dasar
Jika ada korpus RAG di project Anda yang memilih menggunakan database yang dikelola RAG untuk penelusuran vektor, Anda akan dikenai biaya untuk instance Spanner yang dikelola RAG. Mesin RAG Vertex AI menampilkan biaya Spanner dari project yang dikelola RAG yang sesuai ke project Anda Google Cloud , sehingga Anda dapat melihat dan membayar biaya instance Spanner. Untuk mengetahui detail harga Spanner selengkapnya, lihat Harga Spanner. |
| Peringkat ulang untuk Mesin RAG Vertex AI | Alat peringkat berikut didukung setelah pengambilan:
|
Menghapus Mesin RAG Vertex AI
Contoh kode berikut menunjukkan cara menghapus Mesin RAG Vertex AI untuk Google Cloud konsol, Python, dan REST:
Parameter API dan contoh kode versi 1 (v1) parameters and code samples.
Langkah berikutnya
- Untuk mempelajari cara menggunakan Vertex AI SDK untuk menjalankan tugas Mesin RAG Vertex AI, lihat Panduan memulai RAG untuk Python.
- Untuk mempelajari grounding, lihat Grounding overview.
- Untuk mempelajari respons dari RAG lebih lanjut, lihat Output Pengambilan dan Pembuatan Mesin RAG Vertex AI.
- Untuk mempelajari arsitektur RAG: