Ringkasan Mesin RAG di Gemini Enterprise Agent Platform

Halaman ini menjelaskan apa itu RAG Engine dan cara kerjanya.

Deskripsi Konsol
Untuk mempelajari cara menggunakan Vertex AI SDK untuk menjalankan tugas RAG Engine di Gemini Enterprise Agent Platform, lihat panduan memulai RAG untuk Python. Coba RAG Engine

Ringkasan

Mesin RAG, komponen Gemini Enterprise Agent Platform, memfasilitasi Retrieval-Augmented Generation (RAG). Mesin RAG juga merupakan framework data untuk mengembangkan aplikasi model bahasa besar (LLM) dengan konteks yang diperkuat. Peningkatan konteks terjadi saat Anda menerapkan LLM ke data Anda. Ini mengimplementasikan Retrieval-Augmented Generation (RAG).

Masalah umum pada LLM adalah bahwa LLM tidak memahami pengetahuan pribadi, yaitu data organisasi Anda. Dengan RAG Engine, Anda dapat memperkaya konteks LLM dengan informasi pribadi tambahan, sehingga model dapat mengurangi halusinasi dan menjawab pertanyaan dengan lebih akurat.

Dengan menggabungkan sumber pengetahuan tambahan dengan pengetahuan yang sudah dimiliki LLM, konteks yang lebih baik akan diberikan. Konteks yang ditingkatkan bersama dengan kueri akan meningkatkan kualitas respons LLM.

Gambar berikut mengilustrasikan konsep utama untuk memahami Mesin RAG.

Konsep utama RAG Agent Platform

Konsep ini tercantum dalam urutan proses Retrieval-Augmented Generation (RAG).

  1. Penyerapan data: Menyerap data dari berbagai sumber data. Misalnya, file lokal, Cloud Storage, dan Google Drive.

  2. Transformasi data: Konversi data dalam persiapan pengindeksan. Misalnya, data dibagi menjadi beberapa bagian.

  3. Embedding: Representasi numerik kata atau potongan teks. Angka-angka ini menangkap makna semantik dan konteks teks. Kata atau teks yang serupa atau terkait cenderung memiliki embedding yang serupa, yang berarti kata atau teks tersebut lebih berdekatan dalam ruang vektor berdimensi tinggi.

  4. Pengindeksan data: RAG Engine membuat indeks yang disebut korpus. Indeks menyusun pusat informasi sehingga dioptimalkan untuk penelusuran. Misalnya, indeks ini seperti daftar isi mendetail untuk buku referensi yang sangat besar.

  5. Pengambilan (Retrieval): Saat pengguna mengajukan pertanyaan atau memberikan perintah, komponen pengambilan di RAG Engine akan menelusuri pusat informasinya untuk menemukan informasi yang relevan dengan kueri.

  6. Generasi: Informasi yang diambil menjadi konteks yang ditambahkan ke kueri pengguna asli sebagai panduan bagi model AI generatif untuk menghasilkan respons yang beralasan dan relevan secara faktual.

Region yang didukung

RAG Engine didukung di wilayah berikut:

Wilayah Lokasi Deskripsi Tahap peluncuran
us-central1 Iowa Versi v1 dan v1beta1 didukung. Allowlist, GA
us-east4 Virginia Versi v1 dan v1beta1 didukung. Allowlist, GA
us-east1 Moncks Corner, SC Versi v1 dan v1beta1 didukung. Daftar yang diizinkan, Pratinjau
europe-west3 Frankfurt, Jerman Versi v1 dan v1beta1 didukung. GA
europe-west4 Eemshaven, Belanda Versi v1 dan v1beta1 didukung. GA
asia-east1 Taiwan Versi v1 dan v1beta1 didukung. Pratinjau
asia-northeast1 Tokyo Versi v1 dan v1beta1 didukung. Pratinjau
asia-northeast3 Seoul Versi v1 dan v1beta1 didukung. Pratinjau
asia-south1 Mumbai Versi v1 dan v1beta1 didukung. Pratinjau
asia-southeast1 Singapura Versi v1 dan v1beta1 didukung. Pratinjau
europe-central2 Warsawa Versi v1 dan v1beta1 didukung. Pratinjau
europe-north1 Finlandia Versi v1 dan v1beta1 didukung. Pratinjau
europe-southwest1 Madrid Versi v1 dan v1beta1 didukung. Pratinjau
europe-west1 Belgia Versi v1 dan v1beta1 didukung. Pratinjau
europe-west2 London Versi v1 dan v1beta1 didukung. Pratinjau
europe-west6 Zürich Versi v1 dan v1beta1 didukung. Pratinjau
europe-west8 Milan Versi v1 dan v1beta1 didukung. Pratinjau
europe-west9 Paris Versi v1 dan v1beta1 didukung. Pratinjau
us-east5 Columbus, OH Versi v1 dan v1beta1 didukung. Pratinjau
us-south1 Dallas, TX Versi v1 dan v1beta1 didukung. Pratinjau
us-west1 Oregon Versi v1 dan v1beta1 didukung. Pratinjau
us-west4 Las Vegas, NV Versi v1 dan v1beta1 didukung. Pratinjau
  • us-central1, us-east1, dan us-east4 diubah menjadi Allowlist. Jika Anda ingin bereksperimen dengan RAG Engine, coba region lain.

Menghapus Mesin RAG

Untuk mengetahui informasi selengkapnya tentang cara menghapus Mesin RAG, lihat artikel berikut:

Langkah berikutnya