Membangun aplikasi yang didukung LLM menggunakan LlamaIndex

Halaman ini menjelaskan beberapa kasus penggunaan untuk membangun aplikasi yang didukung LLM menggunakan LlamaIndex yang terintegrasi dengan AlloyDB for PostgreSQL. Link ke notebook di GitHub disediakan untuk membantu Anda mempelajari pendekatan atau membantu mengembangkan aplikasi.

LlamaIndex adalah framework orkestrasi AI generatif yang memungkinkan Anda menghubungkan dan mengintegrasikan sumber data dengan model bahasa besar (LLM). Anda dapat menggunakan LlamaIndex untuk membangun aplikasi yang mengakses dan mengkueri informasi dari data pribadi atau khusus domain menggunakan kueri bahasa alami.

LlamaIndex berfungsi sebagai jembatan antara data kustom dan LLM, sehingga memfasilitasi pengembangan aplikasi asisten pengetahuan dengan kemampuan retrieval-augmented generation (RAG).

LlamaIndex sangat cocok untuk aplikasi yang berfokus pada dokumen karena menekankan pengelolaan dokumen terstruktur, yang menyederhanakan pengindeksan dan pengambilan. Framework ini menampilkan mekanisme kueri yang dioptimalkan yang meningkatkan kecepatan dan relevansi akses informasi, beserta penanganan metadata yang andal untuk pemfilteran yang lebih cermat.

Untuk mengetahui informasi selengkapnya tentang framework LlamaIndex, lihat dokumentasi produk LlamaIndex.

Komponen LlamaIndex

AlloyDB menawarkan antarmuka LlamaIndex berikut:

  • Vector Store
  • Penyimpanan Dokumen
  • Mengindeks Toko
  • Chat Stores
  • Pembaca Dokumen

Pelajari cara menggunakan LlamaIndex dengan Panduan memulai AlloyDB.

Vector Store

Integrasi LlamaIndex ini memungkinkan Anda menggunakan sifat AlloyDB yang andal dan skalabel untuk menyimpan dan mengelola data LlamaIndex Anda. Dengan menggabungkan kemampuan pengindeksan dan kueri LlamaIndex dengan performa dan keandalan tinggi AlloyDB, Anda dapat membangun aplikasi yang didukung LLM yang lebih efisien dan skalabel.

LlamaIndex menguraikan dokumen —DOC, teks, dan PDF— menjadi komponen dokumen yang disebut node. VectorStore hanya dapat berisi vektor embedding dari konten node yang di-ingest dan teks node. Node, yang merupakan konsep kelas pertama, berisi konten teks, penyematan vektor, dan metadata. Anda dapat menerapkan filter pada kolom metadata ini untuk membatasi pengambilan node hanya pada node yang cocok dengan kriteria metadata yang ditentukan.

Untuk menggunakan penyimpanan vektor di AlloyDB, gunakan class AlloyDBVectorStore. Untuk mengetahui informasi selengkapnya, lihat LlamaIndex Vector Stores.

Menyimpan embedding vektor dengan class AlloyDBVectorStore

Notebook AlloyDB untuk penyimpanan vektor menunjukkan cara melakukan hal berikut:

  • Menginisialisasi tabel untuk menyimpan embedding vektor
  • Buat instance class embedding menggunakan Llama Index embeddings model.
  • Lakukan inisialisasi penyimpanan vektor AlloyDBVectorStore default.
  • Buat dan kueri indeks dari penyimpanan vektor menggunakan VectorStoreIndex.
  • Buat Penyimpanan Vektor kustom untuk menyimpan dan memfilter metadata secara efektif.
  • Tambahkan indeks ANN untuk meningkatkan latensi penelusuran.

Penyimpanan Dokumen dan Indeks

Integrasi Penyimpanan Dokumen LlamaIndex mengelola penyimpanan dan pengambilan dokumen terstruktur, yang dioptimalkan untuk kemampuan LlamaIndex yang berfokus pada dokumen. Document Store menyimpan konten yang terkait dengan vektor di penyimpanan vektor.

Untuk mengetahui informasi selengkapnya, lihat dokumentasi produk LlamaIndex Document Stores.

Penyimpanan Indeks memfasilitasi pengelolaan indeks untuk memungkinkan kueri dan pengambilan data yang cepat, misalnya, indeks ringkasan, kata kunci, dan Tree. Index di LlamaIndex adalah penyimpanan ringan hanya untuk metadata node. Pembaruan metadata node tidak memerlukan pengindeksan ulang (baca pembuatan sematan) node lengkap atau semua node dalam dokumen.

Untuk mengetahui informasi selengkapnya, lihat LlamaIndex Index Stores.

Menyimpan dokumen dan indeks

Notebook AlloyDB untuk Penyimpanan Dokumen menunjukkan cara menggunakan AlloyDB untuk menyimpan dokumen dan indeks menggunakan class AlloyDBDocumentStore dan AlloyDBIndexStore. Anda akan mempelajari cara melakukan hal berikut:

  • Buat AlloyDBEngine menggunakan AlloyDBEngine.from_instance().
  • Buat tabel untuk DocumentStore dan IndexStore.
  • Lakukan inisialisasi AlloyDBDocumentStore default.
  • Siapkan AlloyDBIndexStore.
  • Tambahkan dokumen ke Docstore.
  • Menggunakan Penyimpanan Dokumen dengan beberapa indeks.
  • Memuat indeks yang ada.

Chat Stores

Chat Store mempertahankan histori dan konteks percakapan untuk aplikasi berbasis chat, sehingga memungkinkan interaksi yang dipersonalisasi. Penyimpanan Chat menyediakan repositori pusat yang menyimpan dan mengambil pesan chat dalam percakapan, sehingga LLM dapat mempertahankan konteks dan memberikan respons yang lebih relevan berdasarkan dialog yang sedang berlangsung.

Model bahasa besar secara default tidak memiliki status, yang berarti model tersebut tidak mempertahankan input sebelumnya kecuali jika input tersebut diberikan secara eksplisit setiap kali. Dengan menggunakan penyimpanan percakapan, Anda dapat mempertahankan konteks percakapan, sehingga model dapat menghasilkan respons yang lebih relevan dan koheren dari waktu ke waktu.

Modul memori di LlamaIndex memungkinkan penyimpanan dan pengambilan konteks percakapan yang efisien, sehingga memungkinkan interaksi yang lebih personal dan kontekstual dalam aplikasi chat. Anda dapat mengintegrasikan modul memori di LlamaIndex dengan ChatStore dan ChatMemoryBuffer.
Untuk mengetahui informasi selengkapnya, lihat Penyimpanan Chat LlamaIndex.

Menyimpan histori chat

Notebook AlloyDB untuk Penyimpanan Chat menunjukkan cara menggunakan AlloyDB for PostgreSQL untuk menyimpan histori chat menggunakan class AlloyDBChatStore. Anda akan mempelajari cara melakukan hal berikut:

  • Buat AlloyDBEngine menggunakan AlloyDBEngine.from_instance().
  • Lakukan inisialisasi AlloyDBChatStore default.
  • Buat ChatMemoryBuffer.
  • Buat instance class LLM.
  • Gunakan AlloyDBChatStore tanpa konteks penyimpanan.
  • Gunakan AlloyDBChatStore dengan konteks penyimpanan.
  • Buat dan gunakan Chat Engine.

Pembaca Dokumen

Document Reader secara efisien mengambil dan mengubah data dari AlloyDB menjadi format yang kompatibel dengan LlamaIndex untuk pengindeksan. Antarmuka Document Reader menyediakan metode untuk memuat data dari sumber sebagai Documents. Document adalah class yang menyimpan teks dan metadata terkait. Anda dapat menggunakan Pembaca Dokumen untuk memuat dokumen yang ingin Anda simpan di Penyimpanan Dokumen atau digunakan untuk membuat Indeks.

Untuk mengetahui informasi selengkapnya, lihat Pembaca Dokumen LlamaIndex.

Mengambil data sebagai dokumen

Notebook AlloyDB untuk Document Reader menunjukkan cara menggunakan AlloyDB untuk mengambil data sebagai dokumen menggunakan class AlloyDBReader. Anda akan mempelajari cara melakukan hal berikut:

  • Buat AlloyDBEngine menggunakan AlloyDBEngine.from_instance().
  • Buat AlloyDBReader.
  • Muat Dokumen menggunakan argumen table_name.
  • Memuat Dokumen menggunakan kueri SQL.
  • Menetapkan format konten halaman.
  • Muat dokumen.

Langkah berikutnya