Ringkasan bantuan vektor

Bantuan vektor adalah ekstensi Cloud SQL untuk PostgreSQL yang menyederhanakan deployment dan pengelolaan workload vektor Cloud SQL Anda. Alat ini menyediakan framework SQL deklaratif yang membantu Anda menyiapkan kemampuan penelusuran vektor yang siap produksi, seperti pembuatan embedding, pengoptimalan kueri, dan pembuatan indeks. Framework ini mengurangi kompleksitas workload vektor dengan:

  • Menyederhanakan deklarasi maksud: persyaratan (seperti tabel, kolom teks, atau perolehan target) dideklarasikan menggunakan fungsi SQL.
  • Mengotomatiskan praktik terbaik: membuat perintah SQL yang dioptimalkan, yang juga dikenal sebagai rekomendasi, untuk menyiapkan workload vektor menggunakan spesifikasi vektor yang ditentukan dan algoritma penyesuaian otomatis yang dioptimalkan yang menghitung konfigurasi indeks yang optimal.
  • Memberikan transparansi dan kontrol: memberikan penjelasan yang jelas untuk setiap rekomendasi saat mengotomatiskan tugas yang memungkinkan Anda meninjau, mengubah, dan menerapkan rekomendasi sesuai keinginan Anda.
  • Memungkinkan pembuatan prototipe yang cepat: memungkinkan Anda men-deploy penyiapan penelusuran vektor yang telah disesuaikan dengan baik secara cepat, sehingga mengurangi waktu dari konsep hingga produksi.
  • Berfokus pada kemudahan penggunaan: menyederhanakan kompleksitas penelusuran semantik, menjembatani kesenjangan antara persyaratan bisnis dan engineering.

Dengan bantuan vektor, Anda dapat membangun aplikasi end-to-end dengan fitur penelusuran semantik dan penyiapan yang disederhanakan.

Cara kerja bantuan vektor

Untuk menggunakan bantuan vektor, Anda harus menentukan spesifikasi vektor. Framework menggunakan spesifikasi vektor ini, yang juga dikenal sebagai spesifikasi vektor, untuk membuat langkah-langkah yang diperlukan untuk membuat indeks vektor. Bantuan vektor menampilkan langkah-langkah yang diperlukan untuk men-deploy workload vektor Anda sebagai rekomendasi. Setiap kali Anda mengubah spesifikasi vektor, bantuan vektor akan membuat ulang rekomendasi.

Setelah membuat indeks vektor menggunakan langkah-langkah yang direkomendasikan ini, Anda dapat menggunakan bantuan vektor untuk membuat kueri penelusuran yang dioptimalkan.

Spesifikasi bantuan vektor

Menyiapkan spesifikasi indeks vektor, atau spesifikasi vektor, adalah langkah pertama dalam menggunakan bantuan vektor. Spesifikasi vektor adalah objek tempat Anda menentukan maksud dan persyaratan untuk beban kerja vektor Anda. Pesan ini mencakup semua informasi yang diperlukan, termasuk:

  • Tabel dan kolom yang relevan (teks atau vektor)
  • Preferensi model embedding (jika menggunakan pembuatan embedding)
  • Jenis indeks pilihan, seperti HNSW atau IVFFlat.
  • Perolehan target untuk kueri penelusuran
  • Batasan memori atau batasan performa lainnya

Anda menentukan spesifikasi vektor menggunakan fungsi vector_assist.define_spec, dan Anda dapat mengubahnya kapan saja. Sistem menetapkan ID unik ke setiap spesifikasi dan menyimpannya dalam tabel bernama vector_assist.vector_specs.

Bantuan vektor menyimpulkan input spesifikasi dan algoritma penyetelan otomatis yang dioptimalkan yang menghitung konfigurasi indeks yang optimal. Meskipun bantuan vektor menggunakan nilai ini untuk menyederhanakan proses pengembangan, Anda tetap dapat menyesuaikannya agar sesuai dengan preferensi Anda.

Rekomendasi bantuan vektor

Setelah Anda menentukan spesifikasi vektor, bantuan vektor akan memproses input Anda dan membuat rekomendasi. Rekomendasi ini adalah daftar langkah-langkah berguna yang diurutkan, biasanya perintah SQL, yang harus Anda jalankan untuk men-deploy workload vektor sesuai spesifikasi Anda. Setiap rekomendasi mencakup:

  • Kueri SQL yang akan dijalankan.
  • Penjelasan mendetail tentang fungsi kueri dan alasan kueri tersebut direkomendasikan.
  • Informasi tentang potensi kerugian atau biaya, seperti perkiraan ukuran indeks atau waktu pembuatan.

Bantuan vektor menyimpan rekomendasi dalam tabel yang disebut vector_assist.recommendation, dan Anda dapat meninjau, mengubah, dan menerapkannya satu per satu, atau secara keseluruhan.

Setiap kali Anda mengubah spesifikasi vektor untuk workload, bantuan vektor akan membuat ulang rekomendasi agar sesuai dengan spesifikasi yang diperbarui.

Batasan

Saat menggunakan bantuan vektor dengan instance Cloud SQL untuk PostgreSQL, pertimbangkan batasan berikut:

  • Bantuan vektor hanya mendukung PostgreSQL versi 12 dan yang lebih baru.
  • Meskipun bantuan vektor mendukung semua versi pgvector, sebaiknya gunakan versi terbaru untuk performa dan dukungan fitur yang optimal. Untuk mengetahui informasi selengkapnya, lihat pgvector log perubahan.
  • Jika instance Anda menggunakan ekstensi google_ml_integration untuk membuat embedding, maka batasannya juga berlaku saat Anda menggunakan bantuan vektor. Untuk mengetahui informasi selengkapnya, lihat Ringkasan pengelolaan endpoint model.
  • Bantuan vektor hanya mendukung jenis indeks HNSW dan IVFFlat.
  • Bantuan vektor hanya mendukung model embedding teks untuk membuat embedding secara otomatis dan menggunakan text_column_name sebagai parameter input. Jika beban kerja vektor Anda memerlukan model embedding multimodal, gunakan ekstensi google_ml_integration, atau ekstensi lain untuk membuat embedding ini secara manual sebelum menggunakan bantuan vektor untuk mengaktifkan penelusuran semantik pada embedding ini.

Langkah berikutnya