Sebelum Anda memulai

Sebelum mulai menggunakan Vector Search, Anda harus memilih model embedding, menyiapkan data, dan memutuskan jenis endpoint yang akan digunakan. Halaman ini memberikan beberapa informasi tentang cara melakukan hal tersebut.

Menyiapkan embedding Anda

Untuk menggunakan Vector Search, Anda harus menyiapkan embedding Anda. Jika sudah memiliki sematan, lanjutkan ke bagian Memilih endpoint.

Untuk membuat embedding, lakukan langkah berikut:

  1. Memilih model embedding: Tersedia banyak model embedding eksternal yang menawarkan fitur berbeda.

    Vector Search mendukung embedding padat, embedding renggang, dan penelusuran campuran. Penelusuran campuran menggunakan embedding padat dan renggang sesuai dengan bobot yang Anda tentukan untuk jenis embedding tersebut.

    Bergantung pada kasus penggunaan Anda, pilih salah satu jenis model berikut:

    • Siap digunakan: Jika Anda ingin mencocokkan teks dengan teks atau teks dengan gambar secara semantik berdasarkan relevansi teks atau gambar saja. Ini adalah kasus penggunaan standar, jadi Anda tidak perlu melatih atau menyesuaikan model. Penyematan teks adalah opsi yang direkomendasikan untuk kasus penggunaan ini. Platform Agen menggunakan model embedding padat.

    • Model kustom untuk embedding: Jika Anda ingin mencocokkan berdasarkan data Anda sendiri atau kasus penggunaan tertentu.

  2. Menyiapkan data Anda: Bersihkan dan lakukan pra-pemrosesan data Anda untuk memastikan bahwa data tersebut dalam format yang dapat digunakan oleh model embedding.

  3. Melatih model embedding jika Anda menggunakan model kustom: Jika memilih untuk menggunakan model embedding kustom (penyesuaian), Anda perlu melatihnya pada data Anda. Proses ini dapat memakan waktu dan bergantung pada ukuran dan kompleksitas data Anda. Jika Anda menggunakan model terlatih dari Model Garden, Anda dapat melewati langkah ini.

  4. Membuat embedding: Setelah model dilatih, gunakan model tersebut untuk membuat embedding untuk data Anda.

Memilih endpoint

Setelah membuat indeks, Anda akan men-deploy-nya ke endpoint. Untuk mengetahui informasi selengkapnya, lihat Men-deploy dan mengelola endpoint indeks publik dan Men-deploy dan mengelola endpoint indeks di jaringan VPC. Sebaiknya tentukan jenis endpoint yang Anda perlukan sebelum Anda membuat indeks.

Anda dapat men-deploy indeks kueri ke salah satu opsi berikut:

  • Endpoint publik: Jika men-deploy ke endpoint publik, Anda tidak perlu menyiapkan jaringan. Jaringan publik memiliki latensi yang sedikit lebih tinggi, tetapi lebih cepat disiapkan dan lebih mudah dikelola.

  • Endpoint Pribadi: Jika ingin menggunakan VPC, Anda harus menyiapkan jaringan terlebih dahulu. Penelusuran Vektor mendukung dua jenis jaringan pribadi.

Langkah berikutnya

Setelah Anda membuat embedding dan memutuskan tempat untuk men-deploy indeks, langkah selanjutnya adalah mengonfigurasi indeks Anda.