Kasus penggunaan AI agentic: Mengorkestrasi akses ke sistem perusahaan yang berbeda-beda

Dokumen ini memberikan arsitektur tingkat tinggi untuk sistem AI agentik dalam mengatur interaksi dengan sistem perusahaan yang berbeda-beda. Agen pengorkestrasi mengotomatiskan proses yang kompleks dan menyatukan akses ke beberapa sistem perusahaan melalui antarmuka percakapan modern. Sistem ini mungkin berupa aplikasi komersial pihak ketiga atau sistem internal eksklusif. Pendekatan desain ini menghilangkan integrasi sistem point-to-point, sehingga operator Anda dapat menghindari peralihan konteks yang terus-menerus (pemrosesan swivel-chair).

Audiens yang dituju untuk dokumen ini mencakup arsitek, developer, dan administrator yang membangun dan mengelola aplikasi AI agentik di cloud. Dokumen ini mengasumsikan bahwa Anda memiliki pemahaman dasar tentang AI beragensi.

Arsitektur

Diagram berikut menunjukkan arsitektur multi-layer tempat agen pengelola menggunakan AI untuk merutekan interaksi klien dari beberapa saluran ke sistem backend yang sesuai.

Arsitektur untuk aplikasi AI agentik yang mengatur akses ke sistem perusahaan yang berbeda-beda. Arsitektur untuk aplikasi AI agentik yang mengatur akses ke sistem perusahaan yang berbeda-beda.

Komponen dalam arsitektur diatur dalam lapisan berikut:

Lapisan Komponen
Saluran interaksi

Dalam arsitektur contoh, klien berinteraksi dengan sistem AI agentik melalui beberapa saluran berikut:

  • Frontend kustom, seperti aplikasi web yang berkomunikasi dengan agen melalui REST API yang aman dan mendukung proses human-in-the-loop.
  • Antarmuka chat ad hoc di Gemini Enterprise yang memanggil agen sebagai alat yang aman dan memungkinkan pengguna berinteraksi dengan sistem backend yang kompleks menggunakan bahasa alami.
  • Aplikasi eksternal yang memulai alur kerja otomatisasi sistem ke sistem dengan memublikasikan peristiwa bisnis ke topik Pub/Sub.
Inti agentic

Komponen inti arsitektur ini adalah agen orkestrator yang dibangun menggunakan Agent Development Kit (ADK) dan di-deploy di Cloud Run. Pengelola mengelola sistem multi-agen. Platform tanpa server ini menyediakan skalabilitas dan kontrol akses menggunakan Identity and Access Management (IAM) untuk REST API agen.

Untuk mempertahankan status di seluruh tugas multi-langkah, agen menggunakan dukungan ADK bawaan untuk mempertahankan data status di Vertex AI Session Service atau Cloud Storage.

Integrasi standar dengan sistem backend

Untuk komunikasi antara agen dan sistem backend, arsitektur ini menggunakan server Model Context Protocol (MCP) yang di-deploy di Cloud Run.

  • MCP Toolbox for Databases menyediakan serangkaian alat siap pakai yang aman untuk akses ke database seperti Cloud SQL.
  • Server MCP kustom menyediakan akses ke aplikasi backend.

Setiap server MCP mengekspos API sistem backend tertentu sebagai kumpulan alat standar. Server MCP membentuk lapisan anti-kerusakan yang mengisolasi agen dari sistem backend. Pendekatan ini membantu menghindari coupling yang ketat dari agen dengan sistem backend. Hal ini menyederhanakan logika agen dan memungkinkan Anda memodernisasi sistem backend secara terpisah dari agen.

Sistem backend

Dalam contoh arsitektur, agen AI mengatur akses ke sistem backend berikut:

  • Database operasional di Cloud SQL.
  • Aplikasi yang di-deploy di VM Compute Engine.
  • Aplikasi yang berjalan di luar Google Cloud.

Produk yang digunakan

Arsitektur contoh ini menggunakan produk Google Cloud berikut:

  • Vertex AI: Platform ML yang memungkinkan Anda melatih dan men-deploy model ML dan aplikasi AI, serta menyesuaikan LLM untuk digunakan dalam aplikasi yang didukung AI.
  • Cloud Run: Platform komputasi serverless yang memungkinkan Anda menjalankan container langsung di atas infrastruktur Google yang bersifat skalabel.
  • Pub/Sub: Layanan pesan asinkron dan skalabel yang memisahkan layanan yang menghasilkan pesan dari layanan yang memproses pesan tersebut.
  • Gemini Enterprise: Platform terkelola sepenuhnya yang aman untuk men-deploy dan mengelola agen AI dalam perusahaan.
  • Gemini: Rangkaian model AI multimodal yang dikembangkan oleh Google.
  • Cloud Storage: Penyimpanan objek berbiaya rendah dan tanpa batas untuk beragam jenis data. Data dapat diakses dari dalam dan luar Google Cloud, serta direplikasi di berbagai lokasi untuk redundansi.
  • Cloud SQL: Layanan database relasional yang terkelola sepenuhnya untuk membantu Anda menyediakan, mengoperasikan, dan mengelola database MySQL, PostgreSQL, dan SQL Server di Google Cloud.

Kasus penggunaan

Arsitektur ini berguna untuk kasus penggunaan berikut:

  • Mengotomatiskan pemrosesan swivel-chair antara aplikasi eksternal dan internal yang berbeda.
  • Buat antarmuka terpadu untuk beberapa sistem lama tanpa migrasi skala besar.
  • Menambahkan kemampuan percakapan yang cerdas ke proses bisnis yang ada.
  • Memodernisasi aplikasi Anda secara bertahap dengan fungsi berbasis peristiwa.

Arsitektur ini memberikan manfaat berikut:

  • Produktivitas: Otomatiskan tugas berulang untuk mengurangi kesalahan manusia, sehingga tim Anda dapat berfokus pada tugas yang bernilai tambah.
  • Skalabilitas: Gunakan pendekatan berbasis peristiwa untuk mengembangkan, men-deploy, dan menskalakan layanan secara independen.
  • Pengalaman pengguna yang ditingkatkan: Buat antarmuka yang modern dan fleksibel untuk mengintegrasikan proses bisnis yang kompleks.
  • Integrasi yang siap untuk masa depan: Standarisasi integrasi dengan sistem backend menggunakan server MCP, sehingga Anda dapat mengganti dan mengupgrade sistem backend secara terpisah.

Pertimbangan desain

Untuk menerapkan arsitektur ini untuk produksi, pertimbangkan rekomendasi berikut:

  • Keamanan: Untuk layanan Cloud Run, gunakan akun layanan IAM khusus dengan izin berdasarkan prinsip hak istimewa terendah. Amankan API agen dengan mengonfigurasi kontrol traffic masuk Cloud Run untuk membatasi akses ke pemanggil yang diautentikasi.
  • Kemampuan observasi: Dalam sistem terdistribusi, logging dan pelacakan sangat penting untuk pemecahan masalah. Untuk mendapatkan visibilitas ke seluruh alur kerja berbasis agen, siapkan layanan Anda untuk menulis log terstruktur ke Cloud Logging dan memancarkan trace ke Cloud Trace.
  • Performa: Cloud Run menskalakan secara otomatis berdasarkan permintaan dan menskalakan ke nol saat tidak ada beban. Untuk aplikasi yang sensitif terhadap latensi, Anda dapat meminimalkan cold start dengan mengonfigurasi jumlah minimum instance.
  • Otomatisasi deployment: Otomatiskan penyediaan dan pengelolaan resource menggunakan alat infrastruktur sebagai kode (IaC) seperti Terraform. IaC membantu memastikan deployment yang dapat diulang dan diaudit di seluruh pengembangan, penyiapan, dan produksi.
  • Tata kelola: Sederhanakan desain dan deployment infrastruktur aplikasi Anda menggunakan Application Design Center. Anda dapat menggunakan Pusat Desain Aplikasi untuk menentukan template yang menggabungkan aturan tata kelola dan praktik terbaik untuk organisasi Anda.

Langkah berikutnya

Kontributor

Penulis: Casey West | Architecture Advocate, Google Cloud

Kontributor lainnya: