Halaman ini memperkenalkan database vektor yang didukung di Mesin RAG Platform Agen Gemini Enterprise. Anda juga dapat melihat cara menghubungkan database vektor (penyimpanan vektor) ke korpus RAG Anda.
Database vektor memainkan peran penting dalam mengaktifkan pengambilan untuk aplikasi RAG. Database vektor menawarkan cara khusus untuk menyimpan dan membuat kueri embedding vektor, yang merupakan representasi matematika dari teks atau data lain yang menangkap makna dan hubungan semantik. Embedding vektor memungkinkan sistem RAG dengan cepat dan akurat menemukan informasi yang paling relevan dalam pusat informasi yang luas, bahkan saat menangani kueri yang kompleks atau bernuansa. Jika digabungkan dengan model penyematan, database vektor dapat membantu mengatasi batasan LLM, serta memberikan respons yang lebih akurat, relevan, dan komprehensif.
Database vektor yang didukung
Saat membuat korpus RAG, Mesin RAG Platform Agen Gemini Enterprise menawarkan RagManagedDb yang siap digunakan perusahaan sebagai database vektor default, yang tidak memerlukan penyediaan atau pengelolaan tambahan. RagManagedDb menawarkan opsi penelusuran KNN dan ANN, serta memungkinkan peralihan ke tingkat dasar untuk pembuatan prototipe dan eksperimen cepat. Untuk mempelajari lebih lanjut cara memilih strategi pengambilan di
RagManagedDb atau untuk memperbarui tingkat, lihat Menggunakan RagManagedDb dengan
RAG. Agar Mesin RAG Platform Agen Gemini Enterprise dapat membuat dan mengelola database vektor secara otomatis untuk Anda, lihat REST Resource:
projects.locations.ragCorpora
.
Selain RagManagedDb default, Mesin RAG Platform Agen Gemini Enterprise memungkinkan Anda menyediakan dan menggunakan database vektor dalam korpus RAG Anda. Dalam hal ini, Anda bertanggung jawab atas siklus proses dan skalabilitas database vektor Anda.
Membandingkan opsi database vektor
Tabel ini mencantumkan pilihan database vektor yang didukung dalam Mesin RAG Platform Agen Gemini Enterprise dan menyediakan link ke halaman yang menjelaskan cara menggunakan database vektor dalam korpus RAG Anda.
| Database vektor | Manfaat | Paling cocok untuk | Kekurangan | Metrik jarak yang didukung | Jenis penelusuran | Tahap peluncuran |
|---|---|---|---|---|---|---|
RagManagedDb (default) adalah layanan database skalabel yang didistribusikan secara regional yang menawarkan konsistensi sangat tinggi dan ketersediaan tinggi serta dapat digunakan untuk penelusuran vektor.
mudah sederhana cepat |
|
|
|
cosine |
KNN (default) dan ANN | Tersedia secara umum |
| Vector Search adalah layanan database vektor dalam Agent Platform yang dioptimalkan untuk tugas machine learning. |
|
|
|
cosinedot-product |
ANN | Tersedia secara umum |
| Vertex AI Feature Store adalah layanan terkelola untuk mengatur, menyimpan, dan menyalurkan fitur machine learning. |
|
|
|
cosinedot-productL2 squared |
ANN | Pratinjau |
| Weaviate adalah database vektor open source yang fleksibel dan modular. |
|
|
|
cosinedot-productL2 squaredhammingmanhattan |
Dukungan penelusuran Hybrid + ANN | Pratinjau |
| Pinecone adalah database vektor berbasis cloud yang terkelola sepenuhnya dan dirancang untuk penelusuran kesamaan berperforma tinggi. |
|
|
|
cosineeuclideandot-product |
ANN | Tersedia secara umum |
Langkah berikutnya
Untuk membuat korpus RAG, lihat Method: ragCorpora.create
Untuk mencantumkan korpus RAG, lihat Method: ragCorpora.list