Dalam mode deployment Spanner, Vertex AI RAG Engine menggunakan RagManagedDb, yang merupakan instance Spanner siap pakai untuk perusahaan dan terkelola sepenuhnya Google Cloud yang digunakan untuk penyimpanan resource oleh Vertex AI RAG Engine. Anda dapat menggunakannya sebagai database vektor pilihan untuk korpus RAG Anda.
Melalui Spanner, Vertex AI RAG Engine menawarkan database khusus yang konsisten, sangat tersedia, dan sangat skalabel untuk mendukung aplikasi Anda. Untuk mempelajari lebih lanjut Google Cloud Spanner, lihat Spanner.
Penyimpanan data dan penelusuran vektor
Vertex AI RAG Engine menyimpan metadata resource file RAG dan korpus RAG Anda di RagManagedDb, terlepas dari pilihan database vektor Anda. Database vektor hanya digunakan untuk penyimpanan dan pengambilan embedding. Selain penyimpanan resource, RagManagedDb juga dapat digunakan untuk menyimpan dan mengelola representasi vektor dokumen Anda. Database vektor kemudian digunakan untuk mengambil dokumen yang relevan berdasarkan kemiripan semantik dokumen dengan kueri tertentu.
Tingkatan yang tersedia
Vertex AI RAG Engine memungkinkan Anda menskalakan instance RagManagedDb berdasarkan persyaratan penggunaan dan performa menggunakan pilihan dua tingkat. Anda juga dapat menggunakannya untuk menghapus data Vertex AI RAG Engine dengan tingkat ketiga.
Tingkatan adalah setelan tingkat project yang tersedia di resource RagEngineConfig yang memengaruhi korpora RAG menggunakan RagManagedDb. Tingkatan berikut tersedia di RagEngineConfig:
Tingkat yang diskalakan: Tingkat ini menawarkan performa skala produksi beserta fungsi penskalaan otomatis. Layanan ini cocok untuk pelanggan dengan data dalam jumlah besar atau workload yang sensitif terhadap performa. Secara internal, tingkat ini menetapkan instance Spanner ke konfigurasi penskalaan otomatis dengan minimal 1 node (1.000 unit pemrosesan) dan maksimal 10 node (10.000 unit pemrosesan).
Tingkat dasar (default): Tingkat ini menawarkan tingkat komputasi yang hemat biaya dan rendah, yang mungkin cocok untuk beberapa kasus berikut:
- Melakukan eksperimen dengan
RagManagedDb - Ukuran data kecil
- Beban kerja yang tidak sensitif terhadap latensi
- Menggunakan Vertex AI RAG Engine dengan hanya database vektor lainnya
- Melakukan eksperimen dengan
Untuk menawarkan tingkat Dasar, RagManagedDb menetapkan instance Spanner yang mendasarinya ke konfigurasi tetap 100 unit pemrosesan, yang setara dengan 0,1 node.
- Paket yang tidak disediakan: Paket ini menghapus
RagManagedDbdan instance Spanner yang mendasarinya. Tingkat yang Tidak Disediakan akan menonaktifkan layanan Vertex AI RAG Engine dan menghapus data Anda yang disimpan dalam layanan ini, terlepas dari database vektor yang digunakan untukRagCorporaAnda. Tindakan ini akan menghentikan penagihan layanan. Untuk mengetahui informasi selengkapnya tentang penagihan, lihat Penagihan Vertex AI RAG Engine.
Setelah data dihapus, data tersebut tidak dapat dipulihkan. Untuk mulai menggunakan Vertex AI RAG Engine lagi, Anda harus memperbarui tingkat dengan memanggil API UpdateRagEngineConfig atau beralih mode ke Serverless.
Mengelola tingkat
Untuk membaca dan memperbarui tingkat, gunakan API GetRagEngineConfig dan UpdateRagEngineConfig. Lihat halaman Beralih antar-mode untuk contoh kode tentang cara menggunakan API ini.