Pilih pola desain untuk sistem AI agentic Anda

Dokumen ini memberikan panduan untuk membantu Anda memilih pola desain untuk sistem AI agentic Anda. Pola desain agen adalah pendekatan arsitektur umum untuk membangun aplikasi yang memiliki kemampuan agen. Pola desain agen menawarkan framework yang berbeda untuk mengatur komponen sistem, mengintegrasikan model, dan mengatur satu agen atau beberapa agen untuk menyelesaikan alur kerja.

Agen AI efektif untuk aplikasi yang memecahkan masalah terbuka, yang mungkin memerlukan pengambilan keputusan yang otonom dan pengelolaan alur kerja multi-langkah yang kompleks. Agen sangat mahir memecahkan masalah secara real-time dengan menggunakan data eksternal dan mereka sangat mahir mengotomatiskan tugas yang memerlukan banyak pengetahuan. Agen AI cocok digunakan saat Anda memerlukan AI untuk menyelesaikan tugas yang berfokus pada sasaran dengan tingkat otonomi tertentu. Untuk kasus penggunaan lainnya, Anda dapat menggunakan aplikasi AI generatif dan pendukung. Untuk mempelajari perbedaan antara agen AI dan aplikasi AI non-agen, lihat Apa perbedaan antara agen AI, asisten AI, dan bot?

Panduan ini mengasumsikan bahwa Anda memiliki pengetahuan dasar tentang sistem AI agentik dan perbedaan arsitekturnya dengan sistem non-agentik, seperti yang menggunakan penalaran model langsung atau retrieval-augmented generation (RAG).

Untuk ringkasan panduan pola agen, lihat bagian membandingkan pola desain nanti dalam dokumen ini.

Ringkasan proses desain

Berikut adalah langkah-langkah tingkat tinggi untuk memilih pola desain bagi sistem AI agentic Anda. Langkah-langkah ini dijelaskan secara mendetail di bagian selanjutnya dalam dokumen ini.

  1. Tentukan persyaratan Anda: Nilai karakteristik workload Anda, termasuk kompleksitas tugas, ekspektasi latensi dan performa, anggaran biaya, dan kebutuhan keterlibatan manusia.
  2. Tinjau pola desain agen umum: Pelajari pola desain umum dalam panduan ini, yang mencakup sistem agen tunggal dan sistem multi-agen.
  3. Pilih pola: Pilih pola desain yang sesuai berdasarkan karakteristik beban kerja Anda.

Proses ini bukan keputusan satu kali. Anda harus meninjau kembali langkah-langkah ini secara berkala untuk menyempurnakan arsitektur seiring perubahan karakteristik beban kerja, perkembangan persyaratan, atau ketersediaan fitur baru. Google Cloud

Menentukan persyaratan Anda

Pertanyaan berikut bukan daftar periksa lengkap untuk perencanaan. Gunakan pertanyaan ini sebagai titik awal untuk mengidentifikasi sasaran utama sistem agentik Anda dan memilih pola desain terbaik.

  • Karakteristik tugas: Dapatkah tugas Anda diselesaikan dalam langkah-langkah alur kerja yang telah ditentukan sebelumnya atau apakah tugas tersebut bersifat terbuka? Apakah tugas Anda perlu menggunakan model AI untuk mengatur alur kerja?
  • Latensi dan performa: Apakah Anda perlu memprioritaskan respons yang cepat atau interaktif dengan mengorbankan akurasi atau respons berkualitas tinggi? Atau, dapatkah aplikasi Anda mentoleransi penundaan untuk mendapatkan hasil yang lebih akurat atau menyeluruh?
  • Biaya: Berapa anggaran Anda untuk biaya inferensi? Dapatkah Anda mendukung pola yang memerlukan beberapa panggilan ke model untuk satu permintaan?
  • Keterlibatan manusia: Apakah tugas Anda melibatkan keputusan penting, operasi yang sangat penting untuk keselamatan, atau persetujuan subjektif yang memerlukan pertimbangan manusia?

Jika beban kerja Anda dapat diprediksi atau sangat terstruktur, atau jika dapat dieksekusi dengan satu panggilan ke model AI, akan lebih hemat biaya untuk mempelajari solusi non-agen untuk tugas Anda. Misalnya, Anda mungkin tidak memerlukan alur kerja berbasis agen untuk tugas seperti meringkas dokumen, menerjemahkan teks, atau mengklasifikasikan masukan pelanggan. Untuk mengetahui informasi tentang cara memilih komponen arsitektur untuk aplikasi AI generatif yang tidak memerlukan infrastruktur berbasis agen, lihat Memilih model dan infrastruktur untuk aplikasi AI generatif Anda.

Bagian berikut menjelaskan pola desain agen umum untuk membangun sistem AI agentik yang andal dan efektif.

Sistem agen tunggal

Sistem satu agen menggunakan model AI, serangkaian alat yang ditentukan, dan perintah sistem yang komprehensif untuk menangani permintaan pengguna secara mandiri atau menyelesaikan tugas tertentu. Dalam pola mendasar ini, agen mengandalkan kemampuan penalaran model untuk menafsirkan permintaan pengguna, merencanakan urutan langkah, dan memutuskan alat mana yang akan digunakan dari serangkaian alat yang telah ditentukan. Perintah sistem membentuk perilaku agen dengan menentukan tugas inti, persona, dan operasinya, serta kondisi spesifik untuk menggunakan setiap alat.

Diagram berikut menunjukkan tampilan umum pola agen tunggal:

Arsitektur pola desain satu agen.

Sistem agen tunggal ideal untuk tugas yang memerlukan beberapa langkah dan akses ke data eksternal. Misalnya, agen dukungan pelanggan harus mengkueri database untuk menemukan status pesanan, atau asisten peneliti perlu memanggil API untuk meringkas berita terbaru. Sistem non-agen tidak dapat melakukan tugas ini karena tidak dapat menggunakan alat secara mandiri atau menjalankan rencana multi-langkah untuk menyintesis jawaban akhir.

Jika Anda baru memulai pengembangan agen, sebaiknya mulai dengan satu agen. Saat memulai pengembangan agen dengan sistem satu agen, Anda dapat berfokus untuk menyempurnakan logika inti, perintah, dan definisi alat agen sebelum menambahkan komponen arsitektur yang lebih kompleks.

Performa satu agen dapat menjadi kurang efektif saat ia menggunakan lebih banyak alat dan saat tugas menjadi lebih rumit. Anda mungkin mengamati hal ini sebagai peningkatan latensi, pemilihan atau penggunaan alat yang salah, atau kegagalan untuk menyelesaikan tugas. Anda sering kali dapat memitigasi masalah ini dengan menyempurnakan proses penalaran agen menggunakan teknik seperti pola Reason and Act (ReAct). Namun, jika alur kerja Anda mengharuskan agen mengelola beberapa tanggung jawab yang berbeda, teknik ini mungkin tidak cukup. Untuk kasus ini, pertimbangkan sistem multi-agen, yang dapat meningkatkan ketahanan dan performa dengan mendelegasikan keterampilan tertentu kepada agen khusus.

Sistem multi-agen

Sistem multi-agen mengatur beberapa agen khusus untuk memecahkan masalah kompleks yang tidak dapat dikelola dengan mudah oleh satu agen. Prinsip utamanya adalah menguraikan tujuan besar menjadi sub-tugas yang lebih kecil dan menetapkan setiap sub-tugas kepada agen khusus dengan keterampilan tertentu. Kemudian, agen ini berinteraksi melalui alur kerja kolaboratif atau hierarkis untuk mencapai tujuan akhir. Pola multi-agen memberikan desain modular yang dapat meningkatkan skalabilitas, keandalan, dan kemudahan pemeliharaan sistem secara keseluruhan dibandingkan dengan agen tunggal dengan perintah monolitik.

Dalam sistem multi-agen, setiap agen memerlukan konteks tertentu untuk melakukan tugasnya secara efektif. Konteks dapat mencakup dokumentasi, preferensi historis, link yang relevan, histori percakapan, atau batasan operasional apa pun. Proses pengelolaan aliran informasi ini disebut rekayasa konteks. Rekayasa konteks mencakup strategi seperti mengisolasi konteks untuk agen tertentu, mempertahankan informasi di beberapa langkah, atau mengompresi sejumlah besar data untuk meningkatkan efisiensi.

Membangun sistem multi-agen memerlukan pertimbangan tambahan terkait evaluasi, keamanan, keandalan, dan biaya dibandingkan dengan sistem agen tunggal. Misalnya, sistem multi-agen harus menerapkan kontrol akses yang tepat untuk setiap agen khusus, mendesain sistem orkestrasi yang andal untuk memastikan komunikasi antar-agen yang andal, dan mengelola peningkatan biaya operasional dari overhead komputasi saat menjalankan beberapa agen. Untuk contoh arsitektur referensi untuk membangun sistem multi-agen, lihat Sistem AI multi-agen di Google Cloud.

Pola berurutan

Pola berurutan multi-agen menjalankan serangkaian agen khusus dalam urutan linier yang telah ditentukan sebelumnya, dengan output dari satu agen berfungsi sebagai input langsung untuk agen berikutnya. Pola ini menggunakan agen alur kerja berurutan yang beroperasi berdasarkan logika yang telah ditentukan sebelumnya tanpa harus berkonsultasi dengan model AI untuk mengatur subagennya.

Diagram berikut menunjukkan tampilan tingkat tinggi dari pola berurutan multi-agen:

Arsitektur pola desain berurutan multi-agen.

Gunakan pola berurutan untuk proses yang sangat terstruktur dan dapat diulang di mana urutan operasi tidak berubah. Misalnya, pipeline pemrosesan data dapat menggunakan pola ini untuk membuat agen ekstraksi data menarik data mentah terlebih dahulu, lalu meneruskan data tersebut ke agen pembersihan data untuk pemformatan, yang pada gilirannya meneruskan data bersih ke agen pemuatan data untuk menyimpannya dalam database.

Pola berurutan dapat mengurangi latensi dan biaya operasional dibandingkan dengan pola yang menggunakan model AI untuk mengatur alur kerja tugas. Namun, efisiensi ini mengorbankan fleksibilitas. Struktur pipeline yang kaku dan telah ditentukan sebelumnya membuatnya sulit beradaptasi dengan kondisi dinamis atau melewati langkah-langkah yang tidak perlu, yang dapat menyebabkan pemrosesan tidak efisien atau menyebabkan latensi kumulatif yang lebih tinggi jika langkah yang tidak diperlukan lambat.

Pola paralel

Pola paralel multi-agen, yang juga dikenal sebagai pola serentak, beberapa sub-agen khusus menjalankan tugas atau sub-tugas secara independen pada waktu yang sama. Output sub-agen kemudian disintesis untuk menghasilkan respons gabungan akhir. Mirip dengan pola berurutan, pola paralel menggunakan agen alur kerja paralel untuk mengelola cara dan waktu agen lain berjalan tanpa harus berkonsultasi dengan model AI untuk mengorkestrasi subagennya.

Diagram berikut menunjukkan tampilan tingkat tinggi dari pola paralel multi-agen:

Arsitektur pola desain paralel multi-agen.

Gunakan pola paralel saat sub-tugas dapat dieksekusi secara bersamaan untuk mengurangi latensi atau mengumpulkan berbagai perspektif, seperti mengumpulkan data dari berbagai sumber atau mengevaluasi beberapa opsi sekaligus. Misalnya, untuk menganalisis masukan pelanggan, agen paralel dapat mendistribusikan satu entri masukan ke empat agen khusus secara bersamaan: agen analisis sentimen, agen ekstraksi kata kunci, agen kategorisasi, dan agen deteksi urgensi. Agen akhir mengumpulkan keempat output ini ke dalam satu analisis komprehensif tentang masukan tersebut.

Pola paralel dapat mengurangi latensi keseluruhan dibandingkan dengan pendekatan berurutan karena dapat mengumpulkan beragam informasi dari beberapa sumber secara bersamaan. Namun, pendekatan ini menimbulkan pertukaran dalam biaya dan kompleksitas. Menjalankan beberapa agen secara paralel dapat meningkatkan penggunaan resource dan konsumsi token secara langsung, yang menyebabkan biaya operasional yang lebih tinggi. Selain itu, langkah pengumpulan memerlukan logika yang kompleks untuk menyintesis hasil yang berpotensi bertentangan, yang menambah beban pengembangan dan pemeliharaan sistem.

Pola loop

Pola agen loop multi-agen berulang kali menjalankan urutan subagen khusus hingga kondisi penghentian tertentu terpenuhi. Pola ini menggunakan agen alur kerja loop yang, seperti agen alur kerja lainnya, beroperasi berdasarkan logika yang telah ditentukan sebelumnya tanpa berkonsultasi dengan model AI untuk orkestrasi. Setelah semua subagen menyelesaikan tugasnya, agen loop akan mengevaluasi apakah kondisi keluar terpenuhi. Kondisi dapat berupa jumlah maksimum iterasi atau status kustom. Jika kondisi keluar tidak terpenuhi, agen loop akan memulai urutan subagen lagi. Anda dapat menerapkan pola loop dengan kondisi keluar yang dievaluasi di setiap titik dalam alur. Gunakan pola loop untuk tugas yang memerlukan penyempurnaan berulang atau koreksi otomatis, seperti membuat konten dan meminta agen pengkritik meninjaunya hingga memenuhi standar kualitas.

Diagram berikut menunjukkan tampilan umum pola loop multi-agen:

Arsitektur pola desain loop multi-agen.

Pola agen loop menyediakan cara untuk membangun alur kerja iteratif yang kompleks. Hal ini memungkinkan agen menyempurnakan pekerjaannya sendiri dan melanjutkan pemrosesan hingga kualitas atau status tertentu tercapai. Namun, pertimbangan utama pola ini adalah risiko loop tak terbatas. Jika kondisi penghentian tidak ditentukan dengan benar atau jika sub-agen gagal menghasilkan status yang diperlukan untuk berhenti, loop dapat berjalan tanpa batas. Hal ini dapat menyebabkan biaya operasional yang berlebihan, konsumsi resource yang tinggi, dan potensi sistem macet.

Pola peninjauan dan kritik

Pola peninjauan dan kritik multi-agen, yang juga dikenal sebagai pola generator dan kritik, meningkatkan kualitas dan keandalan konten yang dihasilkan dengan menggunakan dua agen khusus, biasanya dalam alur kerja berurutan. Pola peninjauan dan kritik adalah penerapan pola agen loop.

Dalam pola peninjauan dan kritik, agen generator membuat output awal, seperti blok kode atau ringkasan dokumen. Selanjutnya, agen kritik mengevaluasi output ini berdasarkan serangkaian kriteria yang telah ditentukan sebelumnya, seperti akurasi faktual, kepatuhan terhadap aturan pemformatan, atau pedoman keamanan. Berdasarkan evaluasi, kritikus dapat menyetujui konten, menolaknya, atau mengembalikannya ke generator dengan masukan untuk revisi.

Diagram berikut menunjukkan tampilan tingkat tinggi pola ulasan dan kritik multi-agen:

Arsitektur pola desain kritik ulasan multi-agen.

Pola ini cocok untuk tugas yang outputnya harus sangat akurat atau harus sesuai dengan batasan ketat sebelum ditampilkan kepada pengguna atau digunakan dalam proses hilir. Misalnya, dalam alur kerja pembuatan kode, agen generator dapat menulis fungsi untuk memenuhi permintaan pengguna. Kode yang dihasilkan ini kemudian diteruskan ke agen kritik yang bertindak sebagai auditor keamanan. Tugas agen kritik adalah memeriksa kode berdasarkan serangkaian batasan, seperti memindai kerentanan keamanan atau memverifikasi bahwa kode tersebut lulus semua pengujian unit, sebelum kode disetujui untuk digunakan.

Pola peninjau dan kritik dapat meningkatkan kualitas, akurasi, dan keandalan output karena menambahkan langkah verifikasi khusus. Namun, jaminan kualitas ini menimbulkan biaya langsung berupa peningkatan latensi dan biaya operasional. Alur kerja memerlukan setidaknya satu panggilan model tambahan untuk evaluasi kritikus. Jika prosesnya mencakup loop revisi yang membuat konten dikirim kembali untuk disempurnakan, maka latensi dan biaya akan bertambah di setiap iterasi.

Pola penyempurnaan iteratif

Pola penyempurnaan iteratif menggunakan mekanisme perulangan untuk meningkatkan kualitas output secara progresif selama beberapa siklus. Pola penyempurnaan iteratif adalah implementasi pola agen loop.

Dalam pola ini, satu atau beberapa agen bekerja dalam loop untuk mengubah hasil yang disimpan dalam status sesi selama setiap iterasi. Proses ini berlanjut hingga output memenuhi nilai minimum kualitas yang telah ditentukan atau mencapai jumlah maksimum iterasi, yang mencegah loop tak terbatas.

Diagram berikut menunjukkan tampilan tingkat tinggi pola penyempurnaan iteratif multi-agen:

Arsitektur pola desain penyempurnaan iteratif multi-agen.

Pola ini cocok untuk tugas pembuatan yang kompleks di mana outputnya sulit dicapai dalam satu langkah. Contoh tugas tersebut mencakup penulisan dan proses debug sepotong kode, pengembangan rencana multi-bagian yang mendetail, atau pembuatan draf dan revisi dokumen panjang. Misalnya, dalam alur kerja penulisan kreatif, agen dapat membuat draf postingan blog, mengkritik draf tersebut berdasarkan alur dan gaya bahasa, lalu menulis ulang draf berdasarkan kritik tersebut. Proses ini berulang dalam loop hingga hasil kerja agen memenuhi standar kualitas yang telah ditentukan sebelumnya atau hingga pengulangan mencapai jumlah maksimum iterasi.

Pola penyempurnaan iteratif dapat menghasilkan output yang sangat kompleks atau sempurna yang sulit dicapai dalam satu langkah. Namun, mekanisme looping secara langsung meningkatkan latensi dan biaya operasional dengan setiap siklus. Pola ini juga menambah kompleksitas arsitektur, karena memerlukan kondisi keluar yang dirancang dengan cermat—seperti evaluasi kualitas atau batas iterasi maksimum—untuk mencegah biaya yang berlebihan atau eksekusi yang tidak terkontrol.

Pola koordinator

Pola koordinator multi-agen menggunakan agen pusat, koordinator, untuk mengarahkan alur kerja. Koordinator menganalisis dan menguraikan permintaan pengguna menjadi sub-tugas, lalu mengirimkan setiap sub-tugas ke agen khusus untuk dieksekusi. Setiap agen khusus adalah pakar dalam fungsi tertentu, seperti membuat kueri database atau memanggil API.

Pola koordinator berbeda karena menggunakan model AI untuk mengatur dan merutekan tugas secara dinamis. Sebaliknya, pola paralel mengandalkan alur kerja yang dikodekan secara permanen untuk mengirim tugas agar dieksekusi secara bersamaan tanpa memerlukan orkestrasi model AI.

Diagram berikut menunjukkan tampilan umum pola koordinator multi-agen:

Arsitektur pola desain koordinator multi-agen.

Gunakan pola koordinator untuk mengotomatiskan proses bisnis terstruktur yang memerlukan pemilihan rute adaptif. Misalnya, agen layanan pelanggan dapat bertindak sebagai koordinator. Agen koordinator menganalisis permintaan untuk menentukan apakah permintaan tersebut merupakan permintaan status pesanan, pengembalian produk, atau permintaan pengembalian dana. Berdasarkan jenis permintaan, koordinator akan merutekan tugas ke agen khusus yang sesuai.

Pola koordinator menawarkan fleksibilitas dibandingkan dengan alur kerja yang lebih kaku dan telah ditentukan sebelumnya. Dengan menggunakan model untuk merutekan tugas, koordinator dapat menangani berbagai jenis input dan menyesuaikan alur kerja saat runtime. Namun, pendekatan ini juga memperkenalkan pertukaran. Karena koordinator dan setiap agen khusus mengandalkan model untuk penalaran, pola ini menghasilkan lebih banyak panggilan model daripada sistem satu agen. Meskipun pola koordinator dapat menghasilkan penalaran yang berkualitas lebih tinggi, pola ini juga meningkatkan throughput token, biaya operasional, dan latensi keseluruhan jika dibandingkan dengan sistem satu agen.

Pola dekomposisi tugas hierarkis

Pola dekomposisi tugas hierarkis multi-agen mengatur agen ke dalam hierarki multi-tingkat untuk memecahkan masalah kompleks yang memerlukan perencanaan ekstensif. Pola dekomposisi tugas hierarkis adalah penerapan pola koordinator. Agen induk tingkat teratas, atau root, menerima tugas yang kompleks dan bertanggung jawab untuk menguraikan tugas menjadi beberapa sub-tugas yang lebih kecil dan mudah dikelola. Agen root mendelegasikan setiap sub-tugas ke subagen khusus di tingkat yang lebih rendah. Proses ini dapat berulang melalui beberapa lapisan, dengan agen yang secara progresif menguraikan tugas yang ditetapkan hingga tugas cukup sederhana bagi agen pekerja di tingkat terendah untuk dieksekusi secara langsung.

Diagram berikut menunjukkan tampilan umum pola dekomposisi tugas hierarkis multi-agen:

Arsitektur pola desain dekomposisi tugas hierarkis multi-agen.

Gunakan pola dekomposisi tugas hierarkis untuk masalah yang ambigu dan tidak terbatas yang memerlukan penalaran multi-langkah, seperti tugas yang melibatkan riset, perencanaan, dan sintesis. Misalnya, untuk menyelesaikan project riset yang kompleks, agen koordinator menguraikan tujuan tingkat tinggi menjadi beberapa tugas seperti mengumpulkan informasi, menganalisis temuan, dan menyintesis laporan akhir. Agen koordinator kemudian mendelegasikan tugas tersebut ke subagen khusus, seperti agen untuk pengumpulan data, agen analisis, dan agen yang menulis laporan, untuk dieksekusi atau diuraikan lebih lanjut.

Pola dekomposisi tugas hierarkis sangat ideal untuk memecahkan masalah yang sangat kompleks dan ambigu karena secara sistematis menguraikannya menjadi sub-tugas yang dapat dikelola. Pola ini dapat menghasilkan hasil yang lebih komprehensif dan berkualitas tinggi daripada pola yang lebih sederhana. Namun, kemampuan canggih ini menimbulkan kompromi yang signifikan. Struktur multi-level menambah kompleksitas arsitektur yang cukup besar, sehingga membuat sistem lebih sulit dirancang, di-debug, dan dipelihara. Beberapa lapisan pendelegasian dan penalaran juga menghasilkan sejumlah besar panggilan model, yang secara signifikan meningkatkan latensi keseluruhan dan biaya operasional dibandingkan dengan pola lainnya.

Pola kerumunan

Pola swarm multi-agen menggunakan pendekatan komunikasi kolaboratif dari semua ke semua. Dalam pola ini, beberapa agen khusus bekerja sama untuk menyempurnakan solusi secara berulang terhadap masalah yang kompleks.

Diagram berikut menunjukkan tampilan umum pola swarm multi-agen:

Arsitektur pola desain swarm multi-agen.

Pola swarm menggunakan agen dispatcher untuk merutekan permintaan pengguna ke grup kolaboratif agen khusus. Agen dispatcher menafsirkan permintaan dan menentukan agen mana dalam swarm yang paling cocok untuk memulai tugas. Dalam pola ini, setiap agen dapat berkomunikasi dengan setiap agen lainnya, sehingga mereka dapat berbagi temuan, mengkritik proposal, dan mengembangkan pekerjaan masing-masing secara berulang untuk menyempurnakan solusi. Agen mana pun dalam swarm dapat menyerahkan tugas ke agen lain yang dianggap lebih cocok untuk menangani langkah berikutnya, atau dapat mengomunikasikan respons akhir kembali kepada pengguna melalui agen koordinator.

Swarm biasanya tidak memiliki agen koordinator atau supervisor pusat untuk menjaga proses tetap berjalan sesuai rencana. Agen dispatcher tidak mengatur alur kerja agentic, tidak seperti pola koordinator. Sebagai gantinya, agen dispatcher memfasilitasi komunikasi antara subagen swarm dan pengguna. Untuk memastikan bahwa swarm akhirnya berhenti dan menampilkan hasil, Anda harus menentukan kondisi keluar yang eksplisit. Kondisi ini sering kali berupa jumlah maksimum iterasi, batas waktu, atau pencapaian sasaran tertentu, seperti mencapai konsensus.

Gunakan pola swarm untuk masalah ambigu atau sangat rumit yang akan lebih baik jika didiskusikan dan disempurnakan secara berulang. Misalnya, mendesain produk baru dapat melibatkan agen riset pasar, agen teknik, dan agen pemodelan keuangan. Agen akan membagikan ide awal, memperdebatkan pertukaran antara fitur dan biaya, serta secara kolektif menyepakati spesifikasi desain akhir yang menyeimbangkan semua persyaratan yang bersaing.

Pola swarm menyimulasikan tim ahli yang berkolaborasi, sehingga dapat menghasilkan solusi yang sangat berkualitas tinggi dan kreatif. Namun, pola ini merupakan pola multi-agen yang paling kompleks dan mahal untuk diterapkan. Tidak adanya agen yang menggunakan model AI untuk mengatur dapat menimbulkan risiko loop yang tidak produktif atau kegagalan untuk mencapai solusi. Oleh karena itu, Anda harus mendesain logika yang canggih untuk mengelola komunikasi antar-agen yang rumit, mengontrol alur kerja iteratif, dan menangani biaya operasional serta latensi yang signifikan yang terkait dengan menjalankan percakapan multi-turn yang dinamis antara beberapa agen.

Pola berpikir dan bertindak (ReAct)

Pola ReAct adalah pendekatan yang menggunakan model AI untuk menyusun proses pemikiran dan tindakannya sebagai serangkaian interaksi bahasa alami. Dalam pola ini, agen beroperasi dalam loop pemikiran, tindakan, dan pengamatan berulang hingga kondisi keluar terpenuhi.

  • Pemikiran: Model mempertimbangkan tugas dan memutuskan tindakan selanjutnya. Model ini mengevaluasi semua informasi yang telah dikumpulkannya untuk menentukan apakah permintaan pengguna telah dijawab sepenuhnya.
  • Tindakan: Berdasarkan proses berpikirnya, model mengambil salah satu dari dua tindakan:
    • Jika tugas belum selesai, agen akan memilih alat, lalu membuat kueri untuk mengumpulkan informasi lebih lanjut.
    • Jika tugas selesai, tugas akan merumuskan jawaban akhir untuk dikirim kepada pengguna, yang mengakhiri loop.
  • Pengamatan: Model menerima output dari alat dan menyimpan informasi yang relevan dalam memorinya. Karena model menyimpan output yang relevan, model dapat membangun pengamatan sebelumnya, yang membantu mencegah model mengulangi dirinya sendiri atau kehilangan konteks.

Loop iteratif akan berakhir saat agen menemukan jawaban yang meyakinkan, mencapai jumlah iterasi maksimum yang telah ditetapkan sebelumnya, atau mengalami error yang mencegahnya untuk melanjutkan. Loop berulang ini memungkinkan agen membuat rencana secara dinamis, mengumpulkan bukti, dan menyesuaikan pendekatannya saat berupaya mendapatkan jawaban akhir.

Diagram berikut menunjukkan tampilan tingkat tinggi pola ReAct:

Arsitektur pola desain ReAct.

Gunakan pola ReAct untuk tugas dinamis yang kompleks yang memerlukan perencanaan dan adaptasi berkelanjutan. Misalnya, pertimbangkan agen robotik yang harus membuat jalur untuk bertransisi dari status awal ke status tujuan:

  • Pemikiran: Model ini mempertimbangkan jalur optimal untuk bertransisi dari status saat ini ke status tujuan. Selama proses berpikir, model mengoptimalkan metrik seperti waktu atau energi.
  • Tindakan: Model menjalankan langkah berikutnya dalam rencananya dengan bergerak di sepanjang segmen jalur yang dihitung.
  • Pengamatan: Model mengamati dan menyimpan status baru lingkungan. Model akan menyimpan posisi barunya dan setiap perubahan pada lingkungan yang dirasakannya.

Loop ini memungkinkan agen mematuhi batasan dinamis, seperti menghindari rintangan baru atau mematuhi peraturan lalu lintas, dengan terus memperbarui rencananya berdasarkan pengamatan baru. Agen akan terus melakukan loop iteratif hingga mencapai tujuannya atau mengalami error.

Satu agen ReAct dapat lebih sederhana dan hemat biaya untuk diimplementasikan dan dipertahankan daripada sistem multi-agen yang kompleks. Pemikiran model memberikan transkrip penalaran model, yang membantu proses debug. Namun, fleksibilitas ini memiliki kekurangan. Sifat iteratif dan multi-langkah dari loop dapat menyebabkan latensi end-to-end yang lebih tinggi dibandingkan dengan satu kueri. Selain itu, efektivitas agen sangat bergantung pada kualitas penalaran model AI. Oleh karena itu, error atau hasil yang menyesatkan dari alat dalam satu langkah pengamatan dapat menyebar dan menyebabkan jawaban akhir menjadi salah.

Pola yang memerlukan interaksi manusia

Pola human-in-the-loop mengintegrasikan titik intervensi manusia langsung ke dalam alur kerja agen. Pada titik pemeriksaan yang telah ditentukan sebelumnya, agen akan menjeda eksekusinya dan memanggil sistem eksternal untuk menunggu seseorang meninjau pekerjaannya. Pola ini memungkinkan seseorang menyetujui keputusan, memperbaiki kesalahan, atau memberikan input yang diperlukan sebelum agen dapat melanjutkan.

Diagram berikut menunjukkan tampilan umum pola human-in-the-loop:

Arsitektur pola desain human-in-the-loop multi-agen.

Gunakan pola interaksi manusia untuk tugas yang memerlukan pengawasan manusia, penilaian subjektif, atau persetujuan akhir untuk tindakan penting. Tindakan tersebut mencakup menyetujui transaksi keuangan besar, memvalidasi ringkasan dokumen sensitif, atau memberikan masukan subjektif tentang konten materi iklan yang dihasilkan. Misalnya, agen mungkin ditugaskan untuk menganonimkan set data pasien untuk penelitian. Agen akan otomatis mengidentifikasi dan menyamarkan semua informasi kesehatan terlindungi, tetapi akan berhenti di titik pemeriksaan akhir. Kemudian, sistem akan menunggu petugas kepatuhan manusia untuk memvalidasi dataset secara manual dan menyetujui rilisnya, yang membantu memastikan tidak ada data sensitif yang terekspos.

Pola human-in-the-loop meningkatkan keamanan dan keandalan dengan menyisipkan pertimbangan manusia pada titik keputusan penting dalam alur kerja. Pola ini dapat menambah kompleksitas arsitektur yang signifikan karena mengharuskan Anda membangun dan memelihara sistem eksternal untuk interaksi pengguna.

Pola logika kustom

Pola logika kustom memberikan fleksibilitas maksimum dalam desain alur kerja Anda. Pendekatan ini memungkinkan Anda menerapkan logika orkestrasi tertentu yang menggunakan kode, seperti pernyataan bersyarat, untuk membuat alur kerja yang kompleks dengan beberapa jalur percabangan.

Diagram berikut menggambarkan contoh penggunaan pola logika kustom untuk mencatat proses pengembalian dana:

Arsitektur pola desain kustom multi-agen.

Dalam diagram sebelumnya, berikut adalah alur kerja berbasis agen untuk contoh agen pengembalian dana pelanggan:

  1. Pengguna mengirimkan kueri ke agen pengembalian dana pelanggan yang bertindak sebagai agen koordinator.
  2. Logika kustom koordinator pertama-tama memanggil agen verifikasi paralel, yang secara bersamaan mengirimkan dua subagen: agen verifikasi pembeli dan agen kelayakan pengembalian dana.
  3. Setelah hasilnya dikumpulkan, agen koordinator menjalankan alat untuk memeriksa apakah permintaan memenuhi syarat untuk mendapatkan pengembalian dana.
    1. Jika pengguna memenuhi syarat, koordinator akan merutekan tugas ke agen pemroses pengembalian dana, yang memanggil alat process_refund.
    2. Jika pengguna tidak memenuhi syarat, koordinator akan mengarahkan tugas ke alur berurutan terpisah, yang dimulai dengan agen kredit toko dan agen keputusan kredit proses.
  4. Hasil dari jalur mana pun yang diambil akan dikirim ke agen respons akhir untuk merumuskan jawaban bagi pengguna.

Contoh agen pengembalian dana pelanggan memerlukan solusi unik untuk orkestrasi tingkat logikanya, yang melampaui pendekatan terstruktur yang ditawarkan pola lain. Alur kerja ini mencampurkan pola karena menjalankan pemeriksaan paralel, lalu menjalankan cabang bersyarat kustom yang merutekan ke dua proses hilir yang sama sekali berbeda. Jenis alur kerja pola campuran yang kompleks ini adalah kasus penggunaan yang ideal untuk pola logika kustom.

Gunakan pola logika kustom saat Anda memerlukan kontrol terperinci atas eksekusi agen atau saat alur kerja Anda tidak sesuai dengan salah satu pola lain yang dijelaskan dalam dokumen ini. Namun, pendekatan ini meningkatkan kompleksitas pengembangan dan pemeliharaan. Anda bertanggung jawab untuk mendesain, menerapkan, dan men-debug seluruh alur orkestrasi, yang memerlukan lebih banyak upaya pengembangan dan dapat lebih rentan terhadap error daripada menggunakan pola yang telah ditentukan sebelumnya yang didukung oleh alat pengembangan agen seperti Agent Development Kit (ADK).

Untuk mengetahui informasi tentang agen kustom dan cara menerapkan logika kustom menggunakan ADK, lihat Agen kustom.

Membandingkan pola desain

Memilih pola agen adalah keputusan arsitektur mendasar. Setiap pola menawarkan kompromi yang berbeda dalam fleksibilitas, kompleksitas, dan performa. Untuk menentukan pola yang sesuai untuk beban kerja Anda, pertimbangkan pola desain di bagian berikut.

Alur kerja yang deterministik

Alur kerja deterministik mencakup tugas yang dapat diprediksi dan berurutan, serta memiliki jalur alur kerja yang ditentukan dengan jelas dari awal hingga akhir. Langkah-langkah dalam tugas Anda diketahui sebelumnya, dan prosesnya tidak banyak berubah dari satu eksekusi ke eksekusi berikutnya. Berikut adalah pola desain agen untuk alur kerja yang deterministik:

Karakteristik workload Pola desain agen
  • Tugas multi-langkah yang mengikuti alur kerja yang telah ditentukan dan kaku.
  • Tidak memerlukan orkestrasi model.
  • Urutan operasi tetap. Output satu agen adalah input langsung agen berikutnya dalam urutan.
Pola berurutan multi-agen
  • Tugas independen yang dapat dijalankan secara bersamaan.
  • Tidak memerlukan orkestrasi model.
  • Mengurangi latensi keseluruhan dengan menjalankan sub-tugas secara bersamaan.
Pola paralel multi-agen
  • Tugas pembuatan yang terbuka atau kompleks yang sulit diselesaikan dalam satu kali percobaan.
  • Memerlukan agen untuk meningkatkan kualitas output secara progresif selama beberapa siklus.
  • Tidak memerlukan orkestrasi model.
  • Memprioritaskan kualitas output daripada latensi.
Pola penyempurnaan iteratif multi-agen

Alur kerja yang memerlukan orkestrasi dinamis

Alur kerja yang memerlukan orkestrasi dinamis mencakup masalah kompleks yang mengharuskan agen menentukan cara terbaik untuk melanjutkan. Sistem AI agentik perlu merencanakan, mendelegasikan, dan mengoordinasikan tugas secara dinamis tanpa skrip yang telah ditentukan sebelumnya. Berikut adalah pola desain agen untuk alur kerja yang memerlukan orkestrasi otonom dan dinamis:

Karakteristik workload Pola desain agen
  • Tugas terstruktur dan multi-langkah yang memerlukan penggunaan alat eksternal.
  • Memerlukan pengembangan cepat untuk prototipe solusi sebagai bukti konsep.
Pola agen tunggal
  • Memerlukan perutean dinamis ke subagen khusus yang sesuai untuk tugas terstruktur dengan input yang bervariasi.
  • Latensi tinggi karena beberapa panggilan ke model AI koordinator sehingga model tersebut dapat mengarahkan tugas ke sub-agen yang sesuai.
  • Dapat menimbulkan biaya tinggi karena beberapa panggilan ke agen koordinator.
Pola koordinator multi-agen
  • Memerlukan orkestrasi model multi-level untuk tugas yang kompleks, terbuka, dan ambigu.
  • Memerlukan hasil yang komprehensif dan berkualitas tinggi yang menguraikan ambiguitas sebagai tantangan utama.
  • Latensi tinggi karena dekomposisi bertingkat dan multi-level yang menyebabkan beberapa panggilan ke model AI untuk penalaran.
Pola dekomposisi tugas hierarkis multi-agen
  • Memerlukan perdebatan kolaboratif dan penyempurnaan iteratif dari beberapa agen khusus untuk tugas yang sangat kompleks, terbuka, atau ambigu.
  • Memprioritaskan sintesis berbagai perspektif untuk menciptakan solusi yang komprehensif atau kreatif.
  • Latensi tinggi dan biaya operasional karena komunikasi dinamis antar-agen.
Pola swarm multi-agen

Alur kerja yang melibatkan iterasi

Alur kerja yang melibatkan iterasi mencakup tugas-tugas yang output akhirnya dicapai melalui siklus penyempurnaan, masukan, dan peningkatan. Berikut adalah pola desain agen untuk alur kerja yang melibatkan iterasi:

Karakteristik workload Pola desain agen
  • Memerlukan agen untuk melakukan penalaran, bertindak, dan mengamati secara berulang untuk membuat atau menyesuaikan rencana untuk tugas yang kompleks, terbuka, dan dinamis.
  • Memprioritaskan hasil yang lebih akurat dan menyeluruh daripada latensi.
Pola ReAct
  • Memerlukan tugas pemantauan atau polling yang mengulangi tindakan yang telah ditentukan sebelumnya, seperti pemeriksaan otomatis, hingga agen memenuhi kondisi keluar.
  • Latensi yang tidak dapat diprediksi atau berjalan lama saat menunggu kondisi keluar terpenuhi.
Pola loop multi-agen
  • Tugas memerlukan langkah validasi yang berbeda sebelum selesai.
Pola peninjauan dan kritik multi-agen
  • Tugas pembuatan yang terbuka atau kompleks yang sulit diselesaikan dalam satu kali percobaan.
  • Memerlukan agen untuk meningkatkan kualitas output secara progresif selama beberapa siklus.
  • Tidak memerlukan orkestrasi model.
  • Memprioritaskan kualitas output daripada latensi.
Pola penyempurnaan iteratif multi-agen

Alur kerja yang memiliki persyaratan khusus

Alur kerja yang memiliki persyaratan khusus mencakup tugas yang tidak mengikuti pola umum agen. Tugas Anda dapat mencakup logika bisnis yang unik atau memerlukan pertimbangan dan intervensi manusia pada titik-titik penting. Sistem AI agentik Anda adalah mesin yang dibuat khusus untuk satu tujuan tertentu. Berikut adalah pola desain agen untuk alur kerja yang memiliki persyaratan khusus:

Karakteristik workload Pola desain agen
  • Memerlukan pengawasan manusia karena tugas yang berisiko tinggi atau subjektif yang mungkin mencakup persyaratan keamanan, keandalan, dan kepatuhan.
Pola yang memerlukan interaksi manusia
  • Logika bercabang yang kompleks yang melampaui urutan linear langsung.
  • Memerlukan kontrol maksimum untuk menggabungkan aturan yang telah ditetapkan dengan penalaran model.
  • Memerlukan kontrol proses terperinci untuk alur kerja yang tidak sesuai dengan template standar.
Pola logika kustom

Langkah berikutnya

Kontributor

Penulis: Samantha He | Technical Writer

Kontributor lainnya: