Penyesuaian teks

Halaman ini menyediakan prasyarat dan petunjuk mendetail untuk menyesuaikan model Gemini pada data teks menggunakan pembelajaran yang diawasi.

Kasus penggunaan

Penyesuaian memungkinkan Anda mengadaptasi model Gemini dasar untuk tugas khusus. Berikut beberapa kasus penggunaan teks:

  • Mengekstrak informasi terstruktur dari chat: Mengubah percakapan multi-turn menjadi data terorganisir dengan menyesuaikan model untuk mengidentifikasi atribut utama dan menampilkannya dalam format terstruktur seperti JSONL.
  • Kategorisasi dokumen: Menyesuaikan model untuk mengklasifikasikan dokumen panjang secara akurat ke dalam kategori yang telah ditentukan, sehingga memungkinkan organisasi dan pengambilan informasi yang efisien.
  • Pemahaman perintah: Meningkatkan kemampuan model untuk memahami dan menjalankan perintah, sehingga menghasilkan penyelesaian tugas yang lebih akurat dan andal.
  • Peninjauan kode otomatis: Menggunakan penyesuaian untuk membuat model yang mampu memberikan peninjauan kode yang mendalam, mengidentifikasi potensi masalah, dan menyarankan peningkatan.
  • Ringkasan: Membuat ringkasan teks panjang yang ringkas dan informatif dengan menyesuaikan model untuk menangkap esensi konten.
  • Pembuatan kode dan DSL: Menyesuaikan model untuk membuat kode dalam berbagai bahasa pemrograman atau bahasa khusus domain (DSL), sehingga mengotomatiskan tugas pengkodean yang berulang.
  • Peningkatan performa RAG: Meningkatkan kegunaan dan akurasi sistem Retrieval-Augmented Generation (RAG) dengan menyesuaikan model bahasa yang mendasarinya.

Format set data

fileUri untuk set data Anda dapat berupa URI untuk file di bucket Cloud Storage, atau dapat berupa URL HTTP atau HTTPS yang tersedia secara publik.

Berikut adalah contoh set data teks.

Untuk melihat contoh format generik, lihat Contoh set data untuk Gemini.

{
  "systemInstruction": {
    "role": "system",
    "parts": [
      {
        "text": "You are a pirate dog named Captain Barktholomew."
      }
    ]
  },
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hi"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "Argh! What brings ye to my ship?"
        }
      ]
    },
    {
      "role": "user",
      "parts": [
        {
          "text": "What's your name?"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
        }
      ]
    }
  ]
}

Contoh set data

Anda dapat menggunakan contoh set data berikut untuk mempelajari cara menyesuaikan model Gemini. Untuk menggunakan set data ini, tentukan URI dalam parameter yang berlaku saat membuat tugas penyesuaian yang diawasi model teks.

Untuk menggunakan contoh set data penyesuaian, tentukan lokasinya sebagai berikut:

"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_train_data.jsonl",

Untuk menggunakan contoh set data validasi, tentukan lokasinya sebagai berikut:

"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_validation_data.jsonl",

Langkah berikutnya