Google menggunakan teknologi AI untuk menerjemahkan konten ke dalam bahasa pilihan Anda. Terjemahan AI mungkin mengandung kesalahan.

Tentang supervised fine-tuning untuk model LLM Terjemahan

Supervised fine-tuning adalah pilihan yang baik jika Anda memiliki tugas terjemahan dengan data teks berlabel yang tersedia. SFT sangat efektif untuk aplikasi khusus domain yang terjemahannya sangat berbeda dengan data umum yang sebelumnya dilatih di model besar.

Supervised fine-tuning mengadaptasi perilaku model dengan set data berlabel. Proses ini menyesuaikan bobot model untuk meminimalkan perbedaan antara inferensi dan label sebenarnya.

Model yang didukung

Model LLM Terjemahan berikut mendukung penyesuaian yang diawasi:

translation-llm-002

Batasan

Token input dan output maksimum:
- Penayangan: 1.000 (~4.000 karakter)
Ukuran set data validasi: 1.024 contoh
Ukuran file set data pelatihan: Hingga 1 GB untuk JSONL
Panjang contoh pelatihan: 1.000 (~4.000 karakter)
Ukuran adaptor:
- Translation LLM V2: Nilai yang didukung hanya 4. Menggunakan nilai lain (misalnya, 1 atau 8) akan menyebabkan kegagalan.

Kasus penggunaan untuk menggunakan supervised fine-tuning

Model terjemahan umum yang telah dilatih sebelumnya berfungsi dengan baik jika teks yang akan diterjemahkan didasarkan pada struktur teks umum yang dipelajari model. Jika Anda ingin model mempelajari sesuatu yang khusus atau spesifik domain yang menyimpang dari terjemahan umum, sebaiknya pertimbangkan untuk menyesuaikan model tersebut. Misalnya, Anda dapat menggunakan penyesuaian model untuk mengajarkan model hal berikut ini:

Konten spesifik dari domain industri dengan jargon atau gaya
Struktur atau format spesifik untuk menghasilkan output.
Perilaku spesifik seperti kapan harus memberikan output yang singkat atau panjang.
Output yang disesuaikan dan spesifik untuk jenis input tertentu.

Mengonfigurasi region tugas penyesuaian

Data pengguna, seperti set data yang diubah dan model yang disesuaikan, disimpan di region tugas penyesuaian. Satu-satunya region yang didukung adalah us-central1.

Jika menggunakan Vertex AI SDK, Anda dapat menentukan region saat inisialisasi. Contoh:
```
import vertexai
vertexai.init(project='myproject', location='us-central1')
```
Jika Anda membuat tugas supervised fine-tuning dengan mengirim permintaan POST menggunakan metode tuningJobs.create, gunakan URL untuk menentukan region tempat tugas penyesuaian berjalan. Misalnya, di URL berikut, Anda menentukan region dengan mengganti kedua instance TUNING_JOB_REGION dengan region tempat tugas berjalan.
```
 https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
```
Jika menggunakan Google Cloud konsol, Anda dapat memilih nama region di kolom drop-down Region pada halaman Model details. Ini adalah halaman yang sama tempat Anda memilih model dasar dan nama model yang disesuaikan.

Quota

Kuota diterapkan pada jumlah tugas penyesuaian serentak. Setiap project dilengkapi dengan kuota default untuk menjalankan setidaknya satu tugas penyesuaian. Ini adalah kuota global, yang dibagikan di semua region yang tersedia dan model yang didukung. Jika ingin menjalankan lebih banyak tugas secara serentak, Anda harus meminta kuota tambahan untuk Global concurrent tuning jobs.

Harga

Anda akan ditagih untuk penyesuaian berdasarkan harga untuk Model Terjemahan penyesuaian.

Anda juga akan ditagih untuk layanan terkait, seperti Cloud Storage dan Prediksi LLM Terjemahan.

Pelajari tentang harga LLM Terjemahan, harga Cloud Storage.

Langkah berikutnya

Menyiapkan set data supervised fine-tuning.

Tentang supervised fine-tuning untuk model LLM Terjemahan Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.