Halaman ini menjelaskan apa itu RAG Engine dan cara kerjanya.
| Deskripsi | Konsol |
|---|---|
| Untuk mempelajari cara menggunakan Vertex AI SDK untuk menjalankan tugas RAG Engine di Gemini Enterprise Agent Platform, lihat panduan memulai RAG untuk Python. | Coba RAG Engine |
Ringkasan
Mesin RAG, komponen Gemini Enterprise Agent Platform, memfasilitasi Retrieval-Augmented Generation (RAG). Mesin RAG juga merupakan framework data untuk mengembangkan aplikasi model bahasa besar (LLM) dengan konteks yang diperkuat. Peningkatan konteks terjadi saat Anda menerapkan LLM ke data Anda. Ini mengimplementasikan Retrieval-Augmented Generation (RAG).
Masalah umum pada LLM adalah bahwa LLM tidak memahami pengetahuan pribadi, yaitu data organisasi Anda. Dengan RAG Engine, Anda dapat memperkaya konteks LLM dengan informasi pribadi tambahan, sehingga model dapat mengurangi halusinasi dan menjawab pertanyaan dengan lebih akurat.
Dengan menggabungkan sumber pengetahuan tambahan dengan pengetahuan yang sudah dimiliki LLM, konteks yang lebih baik akan diberikan. Konteks yang ditingkatkan bersama dengan kueri akan meningkatkan kualitas respons LLM.
Gambar berikut mengilustrasikan konsep utama untuk memahami Mesin RAG.

Konsep ini tercantum dalam urutan proses Retrieval-Augmented Generation (RAG).
Penyerapan data: Menyerap data dari berbagai sumber data. Misalnya, file lokal, Cloud Storage, dan Google Drive.
Transformasi data: Konversi data dalam persiapan pengindeksan. Misalnya, data dibagi menjadi beberapa bagian.
Embedding: Representasi numerik kata atau potongan teks. Angka-angka ini menangkap makna semantik dan konteks teks. Kata atau teks yang serupa atau terkait cenderung memiliki embedding yang serupa, yang berarti kata atau teks tersebut lebih berdekatan dalam ruang vektor berdimensi tinggi.
Pengindeksan data: RAG Engine membuat indeks yang disebut korpus. Indeks menyusun pusat informasi sehingga dioptimalkan untuk penelusuran. Misalnya, indeks ini seperti daftar isi mendetail untuk buku referensi yang sangat besar.
Pengambilan (Retrieval): Saat pengguna mengajukan pertanyaan atau memberikan perintah, komponen pengambilan di RAG Engine akan menelusuri pusat informasinya untuk menemukan informasi yang relevan dengan kueri.
Generasi: Informasi yang diambil menjadi konteks yang ditambahkan ke kueri pengguna asli sebagai panduan bagi model AI generatif untuk menghasilkan respons yang beralasan dan relevan secara faktual.
Region yang didukung
RAG Engine didukung di wilayah berikut:
| Wilayah | Lokasi | Deskripsi | Tahap peluncuran |
|---|---|---|---|
us-central1 |
Iowa | Versi v1 dan v1beta1 didukung. |
Allowlist, GA |
us-east4 |
Virginia | Versi v1 dan v1beta1 didukung. |
Allowlist, GA |
us-east1 |
Moncks Corner, SC | Versi v1 dan v1beta1 didukung. |
Daftar yang diizinkan, Pratinjau |
europe-west3 |
Frankfurt, Jerman | Versi v1 dan v1beta1 didukung. |
GA |
europe-west4 |
Eemshaven, Belanda | Versi v1 dan v1beta1 didukung. |
GA |
asia-east1 |
Taiwan | Versi v1 dan v1beta1 didukung. |
Pratinjau |
asia-northeast1 |
Tokyo | Versi v1 dan v1beta1 didukung. |
Pratinjau |
asia-northeast3 |
Seoul | Versi v1 dan v1beta1 didukung. |
Pratinjau |
asia-south1 |
Mumbai | Versi v1 dan v1beta1 didukung. |
Pratinjau |
asia-southeast1 |
Singapura | Versi v1 dan v1beta1 didukung. |
Pratinjau |
europe-central2 |
Warsawa | Versi v1 dan v1beta1 didukung. |
Pratinjau |
europe-north1 |
Finlandia | Versi v1 dan v1beta1 didukung. |
Pratinjau |
europe-southwest1 |
Madrid | Versi v1 dan v1beta1 didukung. |
Pratinjau |
europe-west1 |
Belgia | Versi v1 dan v1beta1 didukung. |
Pratinjau |
europe-west2 |
London | Versi v1 dan v1beta1 didukung. |
Pratinjau |
europe-west6 |
Zürich | Versi v1 dan v1beta1 didukung. |
Pratinjau |
europe-west8 |
Milan | Versi v1 dan v1beta1 didukung. |
Pratinjau |
europe-west9 |
Paris | Versi v1 dan v1beta1 didukung. |
Pratinjau |
us-east5 |
Columbus, OH | Versi v1 dan v1beta1 didukung. |
Pratinjau |
us-south1 |
Dallas, TX | Versi v1 dan v1beta1 didukung. |
Pratinjau |
us-west1 |
Oregon | Versi v1 dan v1beta1 didukung. |
Pratinjau |
us-west4 |
Las Vegas, NV | Versi v1 dan v1beta1 didukung. |
Pratinjau |
us-central1,us-east1, danus-east4diubah menjadiAllowlist. Jika Anda ingin bereksperimen dengan RAG Engine, coba region lain.
Menghapus Mesin RAG
Untuk mengetahui informasi selengkapnya tentang cara menghapus Mesin RAG, lihat artikel berikut:
API Versi 1 (v1) parameters
Parameter API v1beta1
Langkah berikutnya
Untuk mempelajari cara menggunakan Vertex AI SDK untuk menjalankan tugas RAG Engine di Platform Agen Gemini Enterprise, lihat Mulai cepat RAG untuk Python.
Untuk mempelajari perujukan, lihat Ringkasan perujukan.
Untuk mempelajari lebih lanjut respons dari RAG, lihat
GenerateContentResponse.