Pengantar penyesuaian

Penyesuaian model adalah proses penting dalam mengadaptasi Gemini untuk melakukan tugas tertentu dengan presisi dan akurasi yang lebih tinggi. Penyesuaian model bekerja dengan menyediakan model dengan set data pelatihan yang berisi sekumpulan contoh tugas hilir tertentu.

Halaman ini memberikan ringkasan penyesuaian model untuk Gemini, menjelaskan opsi penyesuaian yang tersedia untuk Gemini, dan membantu Anda menentukan kapan setiap opsi penyesuaian harus digunakan.

Manfaat penyesuaian model

Penyesuaian model adalah cara efektif untuk menyesuaikan model besar dengan tugas Anda. Ini adalah langkah penting untuk meningkatkan kualitas dan efisiensi model. Penyesuaian model memberikan manfaat berikut:

  • Kualitas yang lebih tinggi untuk tugas tertentu Anda
  • Peningkatan ketahanan model
  • Latensi dan biaya inferensi yang lebih rendah karena perintah yang lebih singkat

Penyesuaian dibandingkan dengan desain perintah

  • Membuat perintah dengan model Gemini yang telah dilatih: Membuat perintah adalah seni menyusun petunjuk yang efektif untuk memandu model AI seperti Gemini dalam menghasilkan output yang Anda inginkan. Hal ini melibatkan desain perintah yang secara jelas menyampaikan tugas, format yang Anda inginkan, dan konteks yang relevan. Anda dapat menggunakan kemampuan Gemini dengan penyiapan minimal. Fitur ini paling cocok untuk:
    • Data berlabel terbatas: Jika Anda memiliki data berlabel dalam jumlah kecil atau tidak dapat melakukan proses penyesuaian yang panjang.
    • Pembuatan prototipe yang cepat: Saat Anda perlu menguji konsep dengan cepat atau mendapatkan performa dasar tanpa investasi besar dalam penyesuaian.
  • Penyesuaian model Gemini yang disesuaikan: Untuk hasil yang lebih disesuaikan, Gemini memungkinkan Anda menyesuaikan modelnya pada set data tertentu. Untuk membuat model AI yang unggul dalam domain tertentu, pertimbangkan penyesuaian. Hal ini melibatkan pelatihan ulang model dasar pada set data berlabel Anda sendiri, menyesuaikan bobotnya dengan tugas dan data Anda. Anda dapat menyesuaikan Gemini dengan kasus penggunaan Anda. Penyesuaian paling efektif jika:
    • Anda memiliki data berlabel: Set data yang cukup besar untuk dilatih (misalnya 100 contoh atau lebih), yang memungkinkan model mempelajari spesifikasi tugas Anda secara mendalam.
    • Tugas yang kompleks atau unik: Untuk skenario saat strategi pembuatan perintah lanjutan tidak cukup, dan model yang disesuaikan dengan data Anda sangat penting.

Sebaiknya mulai dengan pembuatan perintah untuk menemukan perintah yang optimal. Kemudian, lanjutkan ke penyesuaian (jika diperlukan) untuk lebih meningkatkan performa atau memperbaiki error berulang. Meskipun menambahkan lebih banyak contoh mungkin bermanfaat, penting untuk mengevaluasi tempat model melakukan kesalahan sebelum menambahkan lebih banyak data. Data berlabel berkualitas tinggi sangat penting untuk performa yang baik dan lebih baik daripada kuantitas. Selain itu, data yang Anda gunakan untuk penyesuaian harus mencerminkan distribusi perintah, format, dan konteks yang akan ditemui model dalam produksi.

Penyesuaian memberikan manfaat berikut dibandingkan dengan desain perintah:

  • Memungkinkan penyesuaian mendalam pada model dan menghasilkan performa yang lebih baik pada tugas tertentu.
  • Menyelaraskan model dengan sintaksis kustom, petunjuk, aturan semantik khusus domain.
  • Menawarkan hasil yang lebih konsisten dan andal.
  • Mampu menangani lebih banyak contoh sekaligus.
  • Menghemat biaya inferensi dengan menghapus contoh few-shot, petunjuk panjang dalam perintah

Pendekatan penyesuaian

Parameter-efficient tuning dan fine-tuning penuh adalah dua pendekatan untuk menyesuaikan model besar. Kedua metode ini memiliki kelebihan dan implikasinya dalam hal kualitas model dan efisiensi resource.

Parameter-efficient tuning

Parameter-efficient tuning, juga disebut tuning adaptor, memungkinkan adaptasi model besar yang efisien ke tugas atau domain tertentu. Parameter-efficient tuning memperbarui subset parameter model yang relatif kecil selama proses penyesuaian.

Untuk memahami cara Platform Agen Gemini Enterprise mendukung tuning dan penayangan adaptor, Anda dapat menemukan detail selengkapnya dalam whitepaper berikut, Adaptasi Model Dasar Besar.

Fine-tuning penuh

Fine-tuning penuh memperbarui semua parameter model, sehingga cocok untuk mengadaptasi model ke tugas yang sangat kompleks, dengan potensi mencapai kualitas yang lebih tinggi. Namun, fine-tuning penuh memerlukan resource komputasi yang lebih tinggi untuk penyesuaian dan penayangan, sehingga menyebabkan biaya keseluruhan yang lebih tinggi.

Parameter-efficient tuning dibandingkan dengan fine-tuning penuh

Parameter-efficient tuning lebih efisien resource dan hemat biaya dibandingkan dengan fine-tuning penuh. Metode ini menggunakan resource komputasi yang jauh lebih rendah untuk dilatih. Metode ini dapat mengadaptasi model lebih cepat dengan set data yang lebih kecil. Fleksibilitas parameter-efficient tuning menawarkan solusi untuk pembelajaran multi-tugas tanpa perlu pelatihan ulang yang ekstensif.

Metode penyesuaian yang didukung

Agent Platform mendukung supervised fine-tuning untuk menyesuaikan model dasar.

Supervised fine-tuning

Supervised fine-tuning meningkatkan performa model dengan mengajarkan keterampilan baru. Data yang berisi ratusan contoh berlabel digunakan untuk mengajarkan model guna meniru perilaku atau tugas yang diinginkan. Setiap contoh berlabel menunjukkan apa yang akan dihasilkan oleh model selama inferensi.

Saat Anda menjalankan tugas supervised fine-tuning, model akan mempelajari parameter tambahan yang membantu mengenkode informasi yang diperlukan untuk menjalankan tugas yang diinginkan atau mempelajari perilaku yang diinginkan. Parameter ini digunakan selama inferensi. Tugas penyesuaian menghasilkan model baru yang menggabungkan parameter yang baru dipelajari dengan model asli.

Supervised fine-tuning model teks adalah opsi yang bagus jika output model Anda tidak kompleks dan relatif mudah ditentukan. Supervised fine-tuning direkomendasikan untuk klasifikasi, analisis sentimen, ekstraksi entity, ringkasan konten yang tidak kompleks, dan penulisan kueri khusus domain. Untuk model kode, penyesuaian yang diawasi adalah satu-satunya opsi yang tersedia.

Model yang mendukung supervised fine-tuning

Model Gemini berikut mendukung penyesuaian yang diawasi:

Klik untuk meluaskan model yang didukung

Untuk mengetahui informasi selengkapnya tentang penggunaan supervised fine-tuning dengan setiap model, lihat halaman berikut: Menyesuaikan jenis data teks, gambar, audio, dan dokumen.

Penyesuaian preferensi

Penyesuaian preferensi Gemini Enterprise Agent Platform didasarkan pada supervised fine-tuning dengan memungkinkan Anda menyesuaikan model Gemini dengan data masukan manusia.

Penyesuaian preferensi memungkinkan model mempelajari preferensi pengguna subjektif yang sulit ditentukan hanya dengan menggunakan label tertentu dan supervised fine-tuning.

Model yang mendukung penyesuaian preferensi

Model Gemini berikut mendukung penyesuaian preferensi:

Klik untuk meluaskan model yang didukung

Untuk mengetahui informasi selengkapnya tentang penyesuaian preferensi, lihat Tentang penyesuaian preferensi untuk model Gemini.

Checkpoint penyesuaian

Checkpoint penyesuaian memungkinkan Anda menyimpan progres penyesuaian, membandingkan performa checkpoint, dan memilih checkpoint dengan performa terbaik.

Model yang mendukung checkpoint penyesuaian

Model Gemini berikut mendukung checkpoint penyesuaian:

Klik untuk meluaskan model yang didukung

Untuk mengetahui informasi selengkapnya tentang checkpoint penyesuaian, lihat Menggunakan checkpoint dalam penyesuaian Gemini.

Penyesuaian berkelanjutan

Penyesuaian berkelanjutan memungkinkan Anda melanjutkan penyesuaian model atau checkpoint model yang sudah disesuaikan dengan menambahkan lebih banyak epoch atau contoh pelatihan.

Model yang mendukung penyesuaian berkelanjutan

Model Gemini berikut mendukung penyesuaian berkelanjutan:

Klik untuk meluaskan model yang didukung

Untuk mengetahui informasi selengkapnya tentang penyesuaian berkelanjutan, lihat Tentang penyesuaian berkelanjutan untuk model Gemini.

Langkah berikutnya