Halaman ini memperkenalkan database vektor yang didukung di RAG Engine. Anda juga dapat melihat cara menghubungkan database vektor (penyimpanan vektor) ke korpus RAG.
Database vektor memainkan peran penting dalam mengaktifkan pengambilan untuk aplikasi RAG. Database vektor menawarkan cara khusus untuk menyimpan dan membuat kueri embedding vektor, yang merupakan representasi matematika dari teks atau data lain yang menangkap makna dan hubungan semantik. Embedding vektor memungkinkan sistem RAG menemukan informasi yang paling relevan dengan cepat dan akurat dalam pusat informasi yang luas, bahkan saat menangani kueri yang kompleks atau bernuansa. Jika digabungkan dengan model embedding, database vektor dapat membantu mengatasi batasan LLM, dan memberikan respons yang lebih akurat, relevan, dan komprehensif.
Database vektor yang didukung
Saat membuat korpus RAG, RAG Engine menawarkan RagManagedDb yang siap digunakan perusahaan sebagai database vektor default, yang tidak memerlukan penyediaan atau pengelolaan tambahan. RagManagedDb menawarkan opsi penelusuran KNN dan ANN serta memungkinkan beralih ke paket dasar untuk beberapa pembuatan prototipe dan eksperimen cepat. Untuk mempelajari lebih lanjut cara memilih strategi pengambilan di
RagManagedDb atau untuk memperbarui paket, lihat Menggunakan RagManagedDb dengan
RAG. Agar RAG Engine otomatis membuat dan mengelola database vektor untuk Anda, lihat Resource REST:
projects.locations.ragCorpora
.
Selain RagManagedDb default, RAG Engine memungkinkan Anda menyediakan dan menggunakan database vektor dalam korpus RAG. Dalam hal ini, Anda bertanggung jawab atas siklus proses dan skalabilitas database vektor.
Membandingkan opsi database vektor
Tabel ini mencantumkan pilihan database vektor yang didukung dalam RAG Engine dan menyediakan link ke halaman yang menjelaskan cara menggunakan database vektor dalam korpus RAG.
| Database vektor | Manfaat | Terbaik untuk | Kekurangan | Metrik jarak yang didukung | Jenis penelusuran | Tahap peluncuran |
|---|---|---|---|---|---|---|
RagManagedDb (default) adalah layanan database skalabel yang didistribusikan secara regional yang menawarkan konsistensi sangat tinggi dan ketersediaan tinggi serta dapat digunakan untuk penelusuran vektor.
mudah sederhana cepat |
|
|
|
cosine |
KNN (default) dan ANN | Tersedia secara umum |
| Penelusuran Vektor adalah layanan database vektor dalam Agent Platform yang dioptimalkan untuk tugas machine learning. |
|
|
|
cosinedot-product |
ANN | Tersedia secara umum |
| Vertex AI Feature Store adalah layanan terkelola untuk mengatur, menyimpan, dan menyalurkan fitur machine learning. |
|
|
|
cosinedot-productL2 squared |
ANN | Pratinjau |
| Weaviate adalah database vektor open source yang fleksibel dan modular. |
|
|
|
cosinedot-productL2 squaredhammingmanhattan |
Dukungan penelusuran campuran + ANN | Pratinjau |
| Pinecone adalah database vektor berbasis cloud yang terkelola sepenuhnya dan dirancang untuk penelusuran kesamaan berperforma tinggi. |
|
|
|
cosineeuclideandot-product |
ANN | Tersedia secara umum |
Langkah berikutnya
Untuk membuat korpus RAG, lihat Metode: ragCorpora.create
Untuk mencantumkan korpus RAG, lihat Metode: ragCorpora.list