Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Penyesuaian teks

Halaman ini memberikan prasyarat dan petunjuk mendetail untuk menyesuaikan model Gemini pada data teks menggunakan pembelajaran terawasi.

Kasus penggunaan

Penyesuaian memungkinkan Anda mengadaptasi model dasar Gemini untuk tugas khusus. Berikut beberapa kasus penggunaan teks:

Mengekstrak informasi terstruktur dari percakapan: Mengubah percakapan multi-giliran menjadi data yang teratur dengan menyesuaikan model untuk mengidentifikasi atribut utama dan menampilkannya dalam format terstruktur seperti JSONL.
Pengategorian dokumen: Sesuaikan model agar dapat mengklasifikasikan dokumen panjang secara akurat ke dalam kategori yang telah ditentukan, sehingga memungkinkan pengorganisasian dan pengambilan informasi yang efisien.
Pemahaman perintah: Meningkatkan kemampuan model untuk memahami dan mengeksekusi perintah, sehingga menghasilkan penyelesaian tugas yang lebih akurat dan andal.
Peninjauan kode otomatis: Gunakan penyesuaian untuk membuat model yang mampu memberikan peninjauan kode yang informatif, mengidentifikasi potensi masalah, dan menyarankan peningkatan.
Ringkasan: Buat ringkasan yang ringkas dan informatif dari teks panjang dengan menyesuaikan model untuk menangkap esensi konten.
Pembuatan kode dan DSL: Sesuaikan model untuk membuat kode dalam berbagai bahasa pemrograman atau bahasa khusus domain (DSL), sehingga mengotomatiskan tugas coding yang berulang.
Peningkatan performa RAG: Meningkatkan kegunaan dan akurasi sistem Retrieval-Augmented Generation (RAG) dengan menyempurnakan model bahasa yang mendasarinya.

Format set data

fileUri untuk set data Anda dapat berupa URI untuk file di bucket Cloud Storage, atau dapat berupa URL HTTP atau HTTPS yang tersedia secara publik.

Berikut adalah contoh set data teks.

Untuk melihat contoh format generik, lihat Contoh set data untuk Gemini.

{
  "systemInstruction": {
    "role": "system",
    "parts": [
      {
        "text": "You are a pirate dog named Captain Barktholomew."
      }
    ]
  },
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hi"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "Argh! What brings ye to my ship?"
        }
      ]
    },
    {
      "role": "user",
      "parts": [
        {
          "text": "What's your name?"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
        }
      ]
    }
  ]
}

Contoh set data

Anda dapat menggunakan set data sampel berikut untuk mempelajari cara menyesuaikan model Gemini. Untuk menggunakan set data ini, tentukan URI dalam parameter yang berlaku saat membuat tugas supervised fine-tuning model teks.

Untuk menggunakan set data penyesuaian sampel, tentukan lokasinya sebagai berikut:

"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_train_data.jsonl",

Untuk menggunakan set data validasi sampel, tentukan lokasinya sebagai berikut:

"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_validation_data.jsonl",

Langkah berikutnya

Untuk mulai melakukan penyesuaian, lihat Menyesuaikan model Gemini menggunakan supervised fine-tuning.
Untuk mempelajari cara penggunaan supervised fine-tuning dalam solusi yang membangun pusat informasi AI generatif, lihat Solusi Praktis: Pusat informasi AI generatif.

Penyesuaian teks Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Kasus penggunaan

Format set data

Contoh set data

Langkah berikutnya

Penyesuaian teks