Panduan pemula AI generatif

Panduan untuk pemula ini memperkenalkan Anda pada teknologi inti AI generatif dan menjelaskan cara teknologi tersebut bekerja sama untuk mendukung chatbot dan aplikasi. AI generatif (juga dikenal sebagai genAI atau AI gen) adalah bidang machine learning (ML) yang mengembangkan dan menggunakan model ML untuk membuat konten baru.

Model AI generatif sering disebut model bahasa besar (LLM) karena ukurannya yang besar dan kemampuannya untuk memahami dan menghasilkan bahasa alami. Namun, bergantung pada data yang digunakan untuk melatih model, model ini dapat memahami dan menghasilkan konten dari berbagai modalitas, termasuk teks, gambar, video, dan audio. Model yang berfungsi dengan berbagai modalitas data disebut model multimodal.

Google menyediakan rangkaian model AI generatif Gemini yang dirancang untuk kasus penggunaan multimodal dan mampu memproses informasi dari berbagai modalitas, termasuk gambar, video, dan teks.

Pembuatan konten

Agar model AI generatif dapat menghasilkan konten yang berguna dalam aplikasi dunia nyata, model tersebut harus memiliki kemampuan berikut:

  • Pelajari cara melakukan tugas baru:

    Model AI generatif dirancang untuk melakukan tugas umum. Jika Anda ingin model melakukan tugas yang unik untuk kasus penggunaan Anda, Anda harus dapat menyesuaikan model. Di Gemini Enterprise Agent Platform, Anda dapat menyesuaikan model melalui penyesuaian model.

  • Akses informasi eksternal:

    Model AI generatif dilatih menggunakan data dalam jumlah besar. Namun, agar model ini berguna, model tersebut harus dapat mengakses informasi di luar data pelatihannya. Misalnya, jika Anda ingin membuat chatbot layanan pelanggan yang didukung oleh model AI generatif, model tersebut harus memiliki akses ke informasi tentang produk dan layanan yang Anda tawarkan. Di Gemini Enterprise Agent Platform, Anda menggunakan fitur grounding dan panggilan fungsi untuk membantu model mengakses informasi eksternal.

  • Memblokir konten berbahaya:

    Model AI generatif mungkin menghasilkan output yang tidak Anda harapkan, termasuk teks yang menyinggung atau tidak sensitif. Untuk menjaga keamanan dan mencegah penyalahgunaan, model memerlukan filter keamanan untuk memblokir perintah dan respons yang dianggap berpotensi berbahaya. Gemini Enterprise Agent Platform memiliki fitur keamanan bawaan yang mendorong penggunaan layanan AI generatif kami secara bertanggung jawab.

Perintah

Prompt

Alur kerja AI generatif biasanya dimulai dengan prompt. Prompt adalah permintaan bahasa alami yang dikirim ke model AI generatif untuk mendapatkan respons. Bergantung pada modelnya, prompt dapat berisi teks, gambar, video, audio, dokumen, dan modalitas lainnya atau bahkan beberapa modalitas (multimodal).

Membuat prompt untuk mendapatkan respons yang diinginkan dari model adalah praktik yang disebut desain prompt. Meskipun desain prompt merupakan proses uji coba, ada prinsip dan strategi desain prompt yang dapat digunakan untuk mendorong model agar berperilaku dengan cara yang diinginkan. Vertex AI Studio menawarkan alat pengelolaan prompt untuk membantu Anda mengelola prompt.

Model dasar

Model dasar

Perintah dikirim ke model AI generatif untuk pembuatan respons. Gemini Enterprise Agent Platform memiliki berbagai model dasar AI generatif yang dapat diakses melalui API terkelola, termasuk:

  • Gemini API: Penalaran tingkat lanjut, chat multiturn, pembuatan kode, dan perintah multimodal.

Model tersebut memiliki ukuran, modalitas, dan biaya yang berbeda. Anda dapat menjelajahi model Google, serta model terbuka dan model dari partner Google, di Model Garden.

Penyesuaian model

Penyesuaian model

Anda dapat menyesuaikan perilaku default model dasar Google agar dapat secara konsisten memberikan hasil yang diinginkan tanpa menggunakan prompt yang kompleks. Proses penyesuaian ini disebut penyesuaian model. Penyesuaian model membantu Anda mengurangi biaya dan latensi permintaan dengan memungkinkan Anda menyederhanakan prompt Anda.

Gemini Enterprise Agent Platform juga menawarkan alat evaluasi model untuk membantu Anda mengevaluasi performa model yang disesuaikan. Setelah model yang disesuaikan siap produksi, Anda dapat men-deploy-nya ke endpoint dan memantau performa seperti dalam alur kerja MLOps standar.

Mengakses informasi eksternal

Augmentation (Augmentasi)

Gemini Enterprise Agent Platform menawarkan beberapa cara untuk memberikan akses model ke API eksternal dan informasi real-time.

  • Grounding: Menghubungkan respons model ke sumber kebenaran, seperti data Anda sendiri atau penelusuran web, sehingga membantu mengurangi halusinasi.
  • RAG: Menghubungkan model ke sumber pengetahuan eksternal, seperti dokumen dan database, untuk menghasilkan respons yang lebih akurat dan informatif.
  • Panggilan fungsi: Memungkinkan model berinteraksi dengan API eksternal untuk mendapatkan informasi real-time dan melakukan tugas dunia nyata.

Pemeriksaan kutipan

Pemeriksaan kutipan

Setelah respons dibuat, Gemini Enterprise Agent Platform akan memeriksa apakah kutipan perlu disertakan dalam respons atau tidak. Jika sejumlah besar teks dalam respons berasal dari sumber tertentu, sumber tersebut akan ditambahkan ke metadata kutipan dalam respons.

Responsible AI dan keamanan

Responsible AI dan keamanan

Lapisan pemeriksaan terakhir yang melewati prompt dan respons sebelum ditampilkan adalah filter keamanan. Gemini Enterprise Agent Platform memeriksa prompt dan respons untuk mengetahui seberapa banyak prompt atau respons yang termasuk dalam kategori keamanan. Jika nilai minimum untuk satu atau beberapa kategori terlampaui, respons akan diblokir dan Gemini Enterprise Agent Platform akan menampilkan respons penggantian.

Respons

Respons

Jika prompt dan respons lulus pemeriksaan filter keamanan, respons akan ditampilkan. Biasanya, respons ditampilkan sekaligus. Namun, dengan Agent Platform, Anda juga dapat menerima respons secara bertahap karena peristiwa tersebut dihasilkan dengan mengaktifkan streaming.

Mulai

Coba salah satu panduan memulai ini untuk mulai menggunakan AI generatif di Agent Platform: