API Vertex AI untuk membangun pengalaman penelusuran dan RAG

Vertex AI menawarkan serangkaian API untuk membantu Anda membangun aplikasi Retrieval-Augmented Generation (RAG) atau mesin telusur. Halaman ini memperkenalkan API tersebut.

Retrieval dan generation

RAG adalah metodologi yang memungkinkan Model Bahasa Besar (LLM) menghasilkan respons yang didasarkan pada sumber data pilihan Anda. Ada dua tahap dalam RAG:

  1. Retrieval: Mendapatkan fakta yang paling relevan dengan cepat dapat menjadi masalah penelusuran umum. Dengan RAG, Anda dapat dengan cepat mengambil fakta yang penting untuk menghasilkan jawaban.
  2. Generation: Fakta yang diambil digunakan oleh LLM untuk menghasilkan respons yang didasarkan pada data tepercaya.

Vertex AI menawarkan opsi untuk kedua tahap agar sesuai dengan berbagai kebutuhan developer.

Retrieval

Pilih metode pengambilan terbaik untuk kebutuhan Anda:

  • Agent Search: Agent Search adalah mesin pengambilan informasi berkualitas Google Penelusuran yang dapat menjadi komponen dalam aplikasi AI generatif apa pun yang menggunakan data perusahaan Anda. Agent Search berfungsi sebagai mesin telusur semantik &kata kunci siap pakai untuk RAG dengan kemampuan memproses berbagai jenis dokumen dan dengan konektor ke berbagai sistem sumber, termasuk BigQuery dan banyak sistem pihak ketiga.

    Untuk mengetahui informasi selengkapnya, lihat Agent Search.

  • Membangun pengambilan Anda sendiri: Jika ingin membangun penelusuran semantik, Anda dapat mengandalkan Vertex AI API untuk komponen sistem RAG kustom Anda. Serangkaian API ini menyediakan implementasi berkualitas tinggi untuk penguraian dokumen, pembuatan embedding, penelusuran vektor, dan peringkat semantik. Penggunaan API tingkat rendah ini memberi Anda fleksibilitas penuh dalam desain pengambil Anda sekaligus menawarkan waktu pemasaran yang dipercepat dan kualitas tinggi dengan mengandalkan Vertex AI API tingkat rendah.

    Untuk mengetahui informasi selengkapnya, lihat Membangun Retrieval-Augmented Generation Anda sendiri.

  • Menyertakan pengambilan yang ada: Anda dapat menggunakan penelusuran yang ada sebagai pengambil untuk pembuatan berbasis data tepercaya. Anda juga dapat mendasarkan respons pada data tepercaya menggunakan RAG untuk meningkatkan kualitas penelusuran yang ada. Untuk mengetahui informasi selengkapnya, lihat Ringkasan grounding.

  • Vertex AI RAG Engine: Vertex AI RAG Engine menyediakan runtime yang dikelola sepenuhnya untuk orkestrasi RAG, yang memungkinkan developer membangun RAG untuk digunakan dalam konteks produksi dan siap untuk perusahaan.

    Untuk mengetahui informasi selengkapnya, lihat Ringkasan Vertex AI RAG Engine dalam dokumentasi AI Generatif di Vertex AI.

  • Google Penelusuran: Jika Anda menggunakan Grounding dengan Google Penelusuran untuk model Gemini, Gemini akan menggunakan Google Penelusuran dan menghasilkan output yang didasarkan pada hasil penelusuran yang relevan. Metode pengambilan ini tidak memerlukan pengelolaan dan Anda mendapatkan pengetahuan dunia yang tersedia untuk Gemini.

    Untuk mengetahui informasi selengkapnya, lihat Grounding with Google Penelusuran dalam dokumentasi AI Generatif di Vertex AI.

Generation

Pilih metode pembuatan terbaik untuk kebutuhan Anda:

  • Mendasarkan pada data Anda: Menghasilkan jawaban yang didasarkan pada data tepercaya untuk kueri pengguna. Grounded Generation API menggunakan model Gemini khusus yang disesuaikan dan merupakan cara efektif untuk mengurangi halusinasi dan memberikan respons yang didasarkan pada sumber Anda atau sumber pihak ketiga, termasuk referensi ke konten dukungan grounding.

    Untuk mengetahui informasi selengkapnya, lihat Menghasilkan jawaban berbasis data tepercaya dengan RAG.

    Anda juga dapat mendasarkan respons pada data Agent Search menggunakan AI Generatif di Vertex AI. Untuk mengetahui informasi selengkapnya, lihat Mendasarkan pada data Anda.

  • Mendasarkan pada Google Penelusuran: Gemini adalah model Google yang paling canggih dan menawarkan grounding siap pakai dengan Google Penelusuran. Anda dapat menggunakannya untuk membangun solusi pembuatan berbasis data tepercaya yang sepenuhnya disesuaikan.

    Untuk mengetahui informasi selengkapnya, lihat Grounding dengan Google Penelusuran dalam dokumentasi AI Generatif di Vertex AI.

  • Model Garden: Jika menginginkan kontrol penuh dan model pilihan Anda, Anda dapat menggunakan salah satu model di Vertex AI Model Garden untuk pembuatan.

Membangun Retrieval-Augmented Generation Anda sendiri

Mengembangkan sistem RAG kustom untuk grounding menawarkan fleksibilitas dan kontrol di setiap langkah proses. Vertex AI menawarkan serangkaian API untuk membantu Anda membuat solusi penelusuran Anda sendiri. Penggunaan API tersebut memberi Anda fleksibilitas penuh dalam desain aplikasi RAG Anda sekaligus menawarkan waktu pemasaran yang dipercepat dan kualitas tinggi dengan mengandalkan Vertex AI API tingkat rendah ini.

  • Document AI Layout Parser. Document AI Layout Parser mengonversi dokumen dalam berbagai format menjadi representasi terstruktur, sehingga konten seperti paragraf, tabel, daftar, dan elemen struktural seperti judul, header halaman, dan footer dapat diakses, serta membuat potongan kontekstual yang memfasilitasi pengambilan informasi dalam berbagai aplikasi AI generatif dan penemuan.

    Untuk mengetahui informasi selengkapnya, lihat Document AI Layout Parser dalam dokumentasi Document AI.

  • Embeddings API: Vertex AI embeddings API memungkinkan Anda membuat embedding untuk input teks atau multimodal. Embedding adalah vektor bilangan floating point yang dirancang untuk menangkap arti inputnya. Anda dapat menggunakan embedding untuk mendukung penelusuran semantik menggunakan Vector Search.

    Untuk mengetahui informasi selengkapnya, lihat Embedding teks dan Embedding multimodal dalam dokumentasi AI Generatif di Vertex AI.

  • Vector Search. Mesin pengambilan adalah bagian penting dari aplikasi RAG atau penelusuran Anda. Vertex AI Vector Search adalah mesin pengambilan yang dapat menelusuri miliaran item yang memiliki kemiripan atau keterkaitan semantik dalam skala besar, dengan kueri per detik (QPS) tinggi, perolehan tinggi, latensi rendah, dan biaya yang rendah. Fitur ini dapat menelusuri embedding padat, dan mendukung penelusuran kata kunci embedding renggang dan penelusuran campuran dalam Pratinjau publik.

    Untuk mengetahui informasi selengkapnya, lihat: Ringkasan Vertex AI Vector Search dalam dokumentasi Vertex AI.

  • Ranking API. Ranking API menerima daftar dokumen dan memberi peringkat ulang dokumen tersebut berdasarkan seberapa relevan dokumen tersebut dengan kueri tertentu. Dibandingkan dengan embedding yang hanya melihat kemiripan semantik dokumen dan kueri, ranking API dapat memberi Anda skor yang lebih akurat untuk seberapa baik dokumen menjawab kueri tertentu.

    Untuk mengetahui informasi selengkapnya, lihat Meningkatkan kualitas penelusuran dan RAG dengan ranking API.

  • Grounded Generation API. Gunakan Grounded Generation API untuk menghasilkan jawaban yang didasarkan pada data tepercaya untuk perintah pengguna. Sumber grounding dapat berupa datastore Agent Search, data kustom yang Anda berikan, atau Google Penelusuran.

    Untuk mengetahui informasi selengkapnya, lihat Menghasilkan jawaban berbasis data tepercaya.

  • Generate Content API. Gunakan Generate Content API untuk menghasilkan jawaban yang didasarkan pada data tepercaya untuk perintah pengguna. Sumber grounding dapat berupa datastore Agent Search atau Google Penelusuran.

    Untuk mengetahui informasi selengkapnya, lihat Mendasarkan pada Google Penelusuran atau Mendasarkan pada data Anda.

  • Check Grounding API. Check Grounding API menentukan seberapa didasarkan pada data tepercaya suatu bagian teks dalam serangkaian teks referensi tertentu. API dapat menghasilkan kutipan pendukung dari teks referensi untuk menunjukkan tempat teks tertentu didukung oleh teks referensi. Selain hal lainnya, API dapat digunakan untuk menilai tingkat grounding respons dari sistem RAG. Selain itu, sebagai fitur eksperimental, API juga menghasilkan kutipan yang bertentangan yang menunjukkan tempat teks tertentu dan teks referensi tidak sesuai.

    Untuk mengetahui informasi selengkapnya, lihat Memeriksa grounding.

Alur kerja: Menghasilkan respons berbasis data tepercaya dari data tidak terstruktur

Berikut adalah alur kerja yang menguraikan cara mengintegrasikan Vertex AI RAG API untuk menghasilkan respons berbasis data tepercaya dari data tidak terstruktur.

  1. Impor dokumen tidak terstruktur Anda, seperti file PDF, file HTML, atau gambar dengan teks, ke lokasi Cloud Storage.
  2. Proses dokumen yang diimpor menggunakan layout parser. Layout parser memecah dokumen tidak terstruktur menjadi potongan dan mengubah konten tidak terstruktur menjadi representasi terstrukturnya. Layout parser juga mengekstrak anotasi dari potongan.
  3. Buat embedding teks untuk potongan menggunakan Vertex AI text embeddings API.
  4. Indeks dan ambil embedding potongan menggunakan Vector Search.
  5. Beri peringkat potongan menggunakan ranking API dan tentukan potongan yang memiliki peringkat teratas
  6. Hasilkan jawaban berbasis data tepercaya berdasarkan potongan yang memiliki peringkat teratas menggunakan Grounded Generation API atau menggunakan Generate Content API.

Jika Anda menghasilkan jawaban menggunakan model pembuatan jawaban selain the model Google, Anda dapat memeriksa grounding jawaban ini menggunakan metode check grounding.