Mode serverless

Mode serverless adalah cara yang direkomendasikan untuk mulai menggunakan Vertex AI RAG Engine. Layanan ini menyediakan database yang terkelola sepenuhnya dan sangat skalabel untuk mendukung resource RAG Engine Vertex AI Anda, tanpa perlu repot menyediakan atau mengelola konfigurasi infrastruktur apa pun. Cara ini menawarkan proses aktivasi yang cepat dan cocok untuk sebagian besar pengguna, termasuk skala perusahaan.

Mode serverless adalah fitur pratinjau dan hanya tersedia di us-central1. Fitur ini tersedia untuk semua orang dan tidak memerlukan daftar yang diizinkan.

Dengan mode Serverless, CUJ Vertex AI RAG Engine Anda tetap sama dengan mode Spanner, kecuali untuk perbedaan utama berikut:

  1. RagManagedDb tidak tersedia sebagai pilihan database vektor saat menggunakan mode Serverless. Sebagai gantinya, database vektor default baru adalah RagManagedVertexVectorSearch yang terkelola sepenuhnya dan sangat skalabel. Untuk mempelajari DB vektor ini lebih lanjut, lihat Menggunakan Vector Search 2.0 dengan RAG.
  2. Kunci Enkripsi yang Dikelola Pelanggan (CMEK) tidak didukung dalam mode Serverless.

Beralih ke mode Serverless

Untuk beralih ke mode Serverless sebagai pilihan mode deployment, lihat halaman Beralih mode.

Menghapus data Anda

Untuk menghapus data Anda dari mode deployment Serverless, ikuti langkah-langkah berikut:

  1. Pastikan mode aktif Anda disetel ke Serverless.
  2. Panggil API ListRagCorpora untuk melihat resource Anda dalam mode ini,
  3. Hapus setiap korpus menggunakan DeleteRagCorpus API.

Harga

Tidak ada biaya tambahan saat menggunakan mode deployment Serverless. Namun, jika Anda memiliki mode Spanner yang aktif, Anda mungkin tetap ditagih untuk mode tersebut. Selain itu, Anda mungkin dikenai biaya dari pilihan model, pengurutan ulang, dan penyimpanan vektor di Vertex AI RAG Engine. Untuk mengetahui informasi selengkapnya, lihat halaman Penagihan RAG Engine Vertex AI.