Dokumen ini menjelaskan arsitektur tingkat tinggi untuk sistem AI multi-agen yang mengatur proses investigasi dan triase yang kompleks di pusat operasi keamanan (SOC). Sistem agen mengatur alur kerja di seluruh sistem keamanan yang berbeda, seperti sistem informasi keamanan dan manajemen peristiwa (SIEM), feed threat intelligence, platform manajemen postur keamanan cloud (CSPM), dan solusi deteksi dan respons endpoint (EDR). Sistem agen dapat melakukan tindakan berikut:
- Cari notifikasi penting dari Google Security Operations.
- Perkaya notifikasi dengan menggunakan Google Threat Intelligence.
- Cari kesalahan konfigurasi aset dari alat CSPM pihak ketiga.
- Menerapkan persetujuan yang memerlukan interaksi manusia.
- Ambil telemetri endpoint mendetail dan histori eksekusi proses dari alat EDR pihak ketiga untuk menyelidiki endpoint yang disusupi atau mencurigakan.
Arsitektur ini membantu meningkatkan efisiensi operator dengan mengurangi peralihan konteks dan memungkinkan operator menjalankan penyelidikan multi-tahap yang kompleks menggunakan satu antarmuka.
Audiens yang dituju untuk dokumen ini mencakup arsitek dan developer yang bertanggung jawab untuk merancang, membangun, dan menerapkan aplikasi AI agentik serta mengintegrasikan aplikasi tersebut dengan sistem keamanan yang ada di lingkungan cloud. Target audiens juga mencakup analis SOC dan administrator sistem yang mengawasi operasi keamanan, menggunakan intelijen ancaman untuk pertahanan proaktif, dan mengelola alur kerja SecOps yang andal untuk deteksi, investigasi, dan respons insiden. Dokumen ini mengasumsikan bahwa Anda memiliki pemahaman dasar tentang konsep AI agentik, termasuk sistem multi-agen, penggunaan alat agentik, dan orkestrasi agentik. Dokumen ini juga mengasumsikan bahwa Anda sudah memahami kasus penggunaan intelijen ancaman, alur kerja operasi keamanan, dan alat keamanan umum. Untuk mengetahui informasi tentang threat intelligence dan alat keamanan umum, lihat Kasus penggunaan dan contoh threat intelligence.
Arsitektur
Bergantung pada persyaratan Anda, Anda dapat memilih model deployment berikut:
- Deployment Cloud Run: Platform serverless yang terkelola sepenuhnya yang memungkinkan Anda men-deploy seluruh aplikasi agen, komponen individual, atau alat kustom sebagai endpoint HTTP yang skalabel tanpa perlu mengelola infrastruktur yang mendasarinya.
- Deployment Vertex AI Agent Engine dengan Gemini Enterprise: Runtime yang terkelola sepenuhnya dan memiliki opini yang dapat Anda gunakan untuk men-deploy, mengoperasikan, dan menskalakan aplikasi agentik dengan overhead operasional minimal.
Untuk mengetahui informasi tentang cara memilih runtime agen, lihat Memilih komponen arsitektur AI agentic Anda.
Tab berikut menyediakan diagram arsitektur yang menunjukkan deployment Cloud Run dan deployment Vertex AI Agent Engine dengan Gemini Enterprise.
Cloud Run
Diagram berikut menunjukkan arsitektur mendetail untuk sistem agen SOC yang di-deploy di Cloud Run:
Arsitektur ini menampilkan komponen berikut:
| Komponen | Deskripsi |
|---|---|
| Cloud Load Balancing | Load Balancer Aplikasi merutekan permintaan inferensi masuk dari analis keamanan ke sistem agen. |
| Google Cloud Armor | Menerapkan kebijakan keamanan berdasarkan aturan firewall aplikasi web (WAF) yang dikonfigurasi. |
| Identity-Aware Proxy (IAP) | Menerapkan model keamanan zero-trust dan memverifikasi identitas pengguna. |
| Model Armor | Model Armor memungkinkan Anda memeriksa dan membersihkan perintah, interaksi alat, dan respons. Layanan ini menyediakan kontrol keamanan yang fleksibel untuk setiap model AI yang mendasarinya. Untuk agen kustom yang berjalan di Cloud Run, integrasikan Model Armor menggunakan Model Armor API. |
| Komposisi agen | Agent Development Kit (ADK) adalah framework pengembangan agen yang membantu Anda membangun agen dan men-deploy-nya sebagai layanan Cloud Run serverless. Untuk detail tentang arsitektur internal sistem agen ini, lihat bagian Arsitektur sistem agen di bagian selanjutnya dalam dokumen ini. |
| Model AI | Untuk menyalurkan inferensi, agen dalam arsitektur ini menggunakan model AI di Vertex AI. |
| Server MCP |
Model Context Protocol (MCP) memfasilitasi akses ke alat dan menstandardisasi
interaksi antara agen dan alat. Sistem agen menggunakan server MCP berikut:
|
Produk yang digunakan
Arsitektur contoh ini menggunakan produk dan alat Google Cloud berikut:
- Cloud Run: Platform komputasi serverless yang memungkinkan Anda menjalankan container langsung di atas infrastruktur Google yang bersifat skalabel.
- Cloud Load Balancing: Portofolio load balancer global dan regional yang berperforma tinggi dan skalabel.
- Google Cloud Armor: Layanan keamanan jaringan yang menawarkan aturan firewall aplikasi web (WAF) dan membantu melindungi dari serangan DDoS dan serangan aplikasi.
- Identity-Aware Proxy (IAP): Layanan yang memungkinkan model akses zero-trust untuk aplikasi dan mesin virtual Anda.
- Google Security Operations: Platform operasi keamanan yang membantu tim keamanan mendeteksi, menyelidiki, dan merespons ancaman cyber.
- Google Threat Intelligence: Solusi keamanan yang memberikan pendekatan komprehensif dan proaktif untuk mengidentifikasi, menganalisis, dan memitigasi ancaman keamanan.
- Server MCP Google Cloud: Layanan jarak jauh yang dikelola Google yang menerapkan Model Context Protocol (MCP) untuk memberikan akses aplikasi AI ke produk dan layanan Google dan Google Cloud.
- Gemini: Rangkaian model AI multimodal yang dikembangkan oleh Google.
- Vertex AI: Platform ML yang dapat Anda gunakan untuk melatih dan men-deploy model ML dan aplikasi AI, serta menyesuaikan LLM untuk digunakan dalam aplikasi yang didukung AI.
- Agent Development Kit (ADK): Kumpulan alat dan library untuk mengembangkan, menguji, dan men-deploy agen AI.
- Model Armor: Layanan yang memberikan perlindungan untuk resource AI generatif dan agentic Anda terhadap injeksi perintah, kebocoran data sensitif, dan konten berbahaya.
Vertex AI Agent Engine dengan Gemini Enterprise
Diagram berikut menunjukkan arsitektur mendetail untuk sistem AI agen SOC yang di-deploy di Vertex AI Agent Engine dengan Gemini Enterprise:
Diagram arsitektur tersebut menampilkan komponen berikut:
| Komponen | Deskripsi |
|---|---|
| Gemini Enterprise | Pengguna berinteraksi dengan sistem agen melalui asisten chat yang disediakan Gemini Enterprise. |
| Komposisi agen | Agent Development Kit (ADK) adalah framework pengembangan agen yang membantu Anda membuat agen kustom, men-deploy agen di Vertex AI Agent Engine, dan mendaftarkan agen dengan Gemini Enterprise. Untuk mengetahui detail tentang arsitektur internal sistem agen ini, lihat bagian Arsitektur sistem agen di bagian selanjutnya dalam dokumen ini. |
| Model AI | Agen dalam arsitektur ini menggunakan model AI dari Model Garden Vertex AI untuk melakukan inferensi. |
| Model Armor | Untuk menerapkan kebijakan keamanan dan kepatuhan perusahaan, Model Armor terintegrasi langsung dengan layanan Google Cloud untuk memberikan inspeksi dan sanitasi inline pada perintah pengguna dan respons model. Melalui integrasi bawaan dengan Gemini Enterprise dan Vertex AI, Model Armor secara otomatis menyaring interaksi antara pengguna dan agen terkelola. Untuk mengetahui informasi selengkapnya, lihat Integrasi Model Armor dengan layanan Google Cloud . |
| Server MCP |
Model Context Protocol (MCP)
memfasilitasi akses ke alat dan menstandardisasi interaksi antara agen dan
alat. Sistem agen menggunakan server MCP berikut:
|
Produk yang digunakan
Arsitektur contoh ini menggunakan produk dan alat Google Cloud berikut:
- Vertex AI Agent Engine: Platform yang memungkinkan Anda menjalankan, mengelola, dan menskalakan agen AI dalam produksi.
- Gemini Enterprise: Platform terkelola sepenuhnya yang aman untuk men-deploy dan mengelola agen AI dalam perusahaan.
- Google Security Operations: Platform operasi keamanan yang membantu tim keamanan mendeteksi, menyelidiki, dan merespons ancaman cyber.
- Google Threat Intelligence: Solusi keamanan yang memberikan pendekatan komprehensif dan proaktif untuk mengidentifikasi, menganalisis, dan memitigasi ancaman keamanan.
- Server MCP Google Cloud: Layanan jarak jauh yang dikelola Google yang menerapkan Model Context Protocol (MCP) untuk memberikan akses aplikasi AI ke produk dan layanan Google dan Google Cloud.
- Gemini: Rangkaian model AI multimodal yang dikembangkan oleh Google.
- Vertex AI: Platform ML yang dapat Anda gunakan untuk melatih dan men-deploy model ML dan aplikasi AI, serta menyesuaikan LLM untuk digunakan dalam aplikasi yang didukung AI.
- Agent Development Kit (ADK): Kumpulan alat dan library untuk mengembangkan, menguji, dan men-deploy agen AI.
- Model Armor: Layanan yang memberikan perlindungan untuk resource AI generatif dan agentic Anda terhadap injeksi perintah, kebocoran data sensitif, dan konten berbahaya.
Arsitektur sistem agen
Bagian ini menjelaskan arsitektur sistem agen SOC kustom untuk deployment Cloud Run atau Gemini Enterprise sebelumnya. Untuk mengatur alur kerja keamanan yang kompleks, agen menggunakan pola dekomposisi tugas hierarkis. Komposisi agen tetap konsisten, terlepas dari metode deployment yang Anda pilih.
Diagram berikut menunjukkan tampilan mendetail arsitektur sistem agen:
Arsitektur ini menampilkan komponen berikut:
| Komponen | Deskripsi |
|---|---|
| Aplikasi | Aplikasi frontend, seperti antarmuka chat, yang berinteraksi dengan pengguna. Anda dapat memilih untuk men-deploy aplikasi dengan Cloud Run atau Vertex AI Agent Engine dengan Gemini Enterprise. |
| Agen |
Arsitektur ini menggunakan agen berikut:
Diagram arsitektur sistem agen menunjukkan contoh arsitektur yang menggunakan dua persona SOC. Bergantung pada kasus penggunaan spesifik Anda, Anda dapat men-deploy persona SOC lain atau membuat persona kustom Anda sendiri. Untuk daftar persona SOC yang lebih luas yang dapat membantu membuat operasi keamanan Anda lebih kuat, lihat Persona SOC. |
| Database pengetahuan RAG | Database ini menyediakan sumber perujukan untuk retrieval-augmented generation (RAG). Database digunakan untuk memberikan rencana respons insiden dan runbook AI kepada agen. Runbook AI adalah alur kerja preskriptif dalam bentuk Keterampilan Agen. |
| Layanan artefak | Layanan terkelola yang menyimpan laporan investigasi dan bukti di Cloud Storage. |
| Memory Bank | Sistem pengelolaan status persisten yang menyimpan topik memori kustom dan memungkinkan agen mempertahankan konteks tentang konteks lingkungan dan ancaman di seluruh sesi. |
| Model AI | Untuk menyajikan inferensi, agen dalam arsitektur ini menggunakan model Gemini terbaru di Vertex AI. |
| Server MCP | Server MCP memfasilitasi akses ke alat dan menstandardisasi interaksi antara agen dan alat. Untuk setiap pasangan agen-alat, klien MCP mengirimkan permintaan ke server MCP yang melalui permintaan tersebut agen mengakses alat, seperti database, sistem file, atau API. |
| Alat agen | Alat ini memungkinkan agen mengambil data perujukan, seperti runbook AI yang sesuai, rencana respons insiden, laporan sebelumnya, dokumentasi internal, dan playbook. |
| ADK | ADK menyediakan alat dan framework untuk mengembangkan, menguji, dan men-deploy agen. ADK mengabstraksi kompleksitas pembuatan agen dan memungkinkan developer AI berfokus pada logika dan kemampuan agen. |
Arsitektur ini menampilkan aliran data berikut:
- Seorang analis keamanan mengirimkan permintaan kepada pengelola SOC, yang merupakan agen koordinator. Misalnya, seorang analis mengirimkan permintaan untuk menyelidiki kasus #37.
- Aplikasi yang di-deploy di Cloud Run atau di Gemini Enterprise merutekan permintaan ke pengelola SOC.
- Manajer SOC menggunakan Gemini untuk menafsirkan permintaan pengguna.
- Pengelola SOC melakukan tugas berikut untuk mengumpulkan konteks permintaan:
- Mengirim kueri ke database pengetahuan RAG untuk mengambil buku pedoman AI yang sesuai, alur kerja preskriptif dalam bentuk Keterampilan AI, dan rencana respons insiden.
- Mengambil kenangan sebelumnya untuk mengidentifikasi apakah sistem agen telah menganalisis insiden serupa.
- Memeriksa Artifact Service untuk menemukan laporan atau bukti yang ada dan terkait dengan permintaan.
- Pengelola SOC menggunakan Gemini dan konteks yang diambilnya untuk menguraikan permintaan menjadi serangkaian sub-tugas dan mengidentifikasi alat yang sesuai.
- Pengelola SOC secara dinamis mengarahkan sub-tugas ke sub-agen khusus, seperti analis Tingkat 1 dan peneliti Cyber Threat Intelligence (CTI).
- Setiap sub-agen melakukan tindakan berikut untuk menjalankan sub-tugas yang ditetapkan:
- Menggunakan Gemini untuk menafsirkan tujuan tugas.
- Mengambil konteks yang relevan dari database pengetahuan RAG, memori, dan artefak.
- Menggunakan server MCP untuk mengumpulkan konteks tambahan berikut guna mendasari
respons:
- Dokumentasi pengetahuan, seperti laporan sebelumnya, dokumentasi internal, dan playbook.
- Telemetri dan intelijen keamanan yang menggunakan data dari Google SecOps dan Google Threat Intelligence.
- Menggunakan Gemini dan konteks yang diambilnya untuk membuat temuan.
- Mengemas temuannya ke dalam ringkasan terstruktur.
- Meneruskan respons perantara kembali ke pengelola SOC.
- Pengelola SOC menerima respons perantara dari sub-agen dan
mengevaluasi temuan terhadap persyaratan buku pedoman AI.
- Jika temuan tidak memenuhi kriteria evaluasi, pengelola SOC akan mengulangi analisis permintaan pengguna dan mendelegasikan sub-tugas kepada sub-agen untuk mengumpulkan data tambahan. Selama loop iteratif ini, pengelola SOC mempertahankan rantai konteks sebelumnya untuk menginformasikan dan meningkatkan kualitas panggilan alat dan delegasi sub-agen berikutnya. SOC Manager melanjutkan loop ini hingga temuan memenuhi kriteria evaluasi.
- Jika temuan memenuhi kriteria evaluasi atau kondisi keluar, seperti
iterasi maksimum, maka pengelola SOC akan melakukan tindakan berikut:
- Menggunakan Gemini untuk menyintesis semua temuan sub-agen menjadi laporan investigasi dan menyimpan laporan ke Artifact Service.
- Menggunakan server MCP Google SecOps untuk memposting hasil ke dinding kasus.
- Menyimpan kenangan baru ke Vertex AI Memory Bank.
- Pengelola SOC mengirimkan link artefak dan ringkasan laporan kembali ke analis keamanan.
Produk yang digunakan
Arsitektur sistem agen dalam dokumen ini menggunakan produk dan alat Google Cloud berikut:
- Google Security Operations: Platform operasi keamanan yang membantu tim keamanan mendeteksi, menyelidiki, dan merespons ancaman cyber.
- Google Threat Intelligence: Solusi keamanan yang memberikan pendekatan komprehensif dan proaktif untuk mengidentifikasi, menganalisis, dan memitigasi ancaman keamanan.
- Server MCP Google Cloud: Layanan jarak jauh yang dikelola Google yang menerapkan Model Context Protocol (MCP) untuk memberikan akses aplikasi AI ke produk dan layanan Google dan Google Cloud.
- Gemini: Rangkaian model AI multimodal yang dikembangkan oleh Google.
- Vertex AI: Platform ML yang dapat Anda gunakan untuk melatih dan men-deploy model ML dan aplikasi AI, serta menyesuaikan LLM untuk digunakan dalam aplikasi yang didukung AI.
- Agent Development Kit (ADK): Kumpulan alat dan library untuk mengembangkan, menguji, dan men-deploy agen AI.
- Model Armor: Layanan yang memberikan perlindungan untuk resource AI generatif dan agentic Anda terhadap injeksi perintah, kebocoran data sensitif, dan konten berbahaya.
- Memory Bank: Layanan penyimpanan persisten yang menghasilkan, menyaring, mengelola, dan mengambil memori jangka panjang berdasarkan percakapan pengguna dengan agen.
- Cloud Storage: Penyimpanan objek berbiaya rendah dan tanpa batas untuk beragam jenis data. Data dapat diakses dari dalam dan luar Google Cloud, serta direplikasi di berbagai lokasi untuk redundansi.
Untuk mengetahui informasi tentang cara memilih komponen alternatif untuk sistem AI agentic Anda, termasuk framework, runtime agen, alat, memori, dan pola desain, lihat Memilih komponen arsitektur AI agentic Anda.
Pertimbangan Desain
Untuk menerapkan arsitektur ini untuk produksi, pertimbangkan rekomendasi berikut:
- Akses alat agen: Untuk mengurangi konsumsi token dan menerapkan prinsip hak istimewa terendah, berikan subset alat ke agen yang berbeda sesuai kebutuhan.
- Penentuan cakupan agen: Untuk meningkatkan akurasi model, tentukan cakupan runbook dan petunjuk sistem setiap agen.
- Pengelolaan jendela konteks: Untuk meminimalkan penggunaan token, desain perintah dan output alat agar ringkas. Gunakan repositori RAG, dan gunakan keterampilan agen untuk memuat konteks terlebih dahulu dan meringkas respons alat yang besar.
- Penyimpanan cache perintah: Untuk mengurangi biaya token input, simpan konten agen statis ke dalam cache, seperti petunjuk sistem, persona, runbook, dan skema alat.
- Pemilihan model: Model yang Anda pilih untuk aplikasi AI akan memengaruhi biaya dan performa secara langsung. Pilih model yang berbeda dalam sistem agentic Anda berdasarkan peran agen dan persyaratan tugas yang berbeda. Untuk penalaran dan dekomposisi tugas yang kompleks, gunakan model penalaran seperti Gemini Pro. Untuk tugas kecil dan langsung, gunakan model yang cepat dan berbiaya rendah seperti Gemini Flash.
- Kompatibilitas skema MCP: Untuk mencegah model AI salah menafsirkan definisi alat dan melakukan panggilan alat yang salah, bersihkan skema alat.
Buat konstruksi mandiri untuk Skema JSON
$refdan$defsserta menormalisasi string jenis huruf besar. - Lingkungan autentikasi: Untuk memastikan autentikasi yang lancar di seluruh lingkungan, konfigurasi pipeline deployment Anda untuk mengelola transisi dari strategi autentikasi pengembangan. Misalnya, Anda mungkin perlu beralih dari Kredensial Default Aplikasi (ADC) dalam eksekusi lokal ke akun layanan yang dikelola oleh Identity and Access Management (IAM) untuk server MCP jarak jauh yang dihosting dalam produksi.
Deployment
Untuk men-deploy contoh implementasi arsitektur ini yang menyediakan agen SOC kustom, gunakan contoh kode Agentic SOC Gemini Enterprise yang tersedia di GitHub.
Sebaiknya Anda melakukan iterasi pada agen dengan urutan berikut:
- Deploy secara lokal dengan web ADK: Mempercepat pembuatan prototipe dan melakukan iterasi dengan cepat pada logika agen.
- Men-deploy ke container lokal: Pastikan lingkungan yang portabel dan immutable dengan dependensi yang konsisten.
- Deploy container ke Cloud Run atau Vertex AI Agent Engine: Menskalakan agen Anda untuk operasi keamanan yang efektif dan memindahkan aplikasi Anda dari pengembangan ke produksi.
Langkah berikutnya
- Pelajari cara meng-hosting agen AI di Cloud Run
- Pelajari keamanan dengan AI generatif.
- Pelajari Ringkasan keamanan Gemini Enterprise.
- Pelajari cara membangun sistem AI multi-agen di Google Cloud.
- Menghubungkan agen ke data Google SecOps menggunakan Server MCP Google SecOps.
- Tinjau Perspektif keamanan dalam Google Cloud Framework Berarsitektur Baik.
- Untuk mengetahui lebih banyak tentang arsitektur referensi, diagram, dan praktik terbaik lainnya, jelajahi Pusat Arsitektur Cloud.
Kontributor
Penulis:
- Ben Perel | Spesialis Keamanan
- Daniel Dye | SecOps AI Engineer
Kontributor lainnya:
- Amr Abdelrazik | Group Product Manager
- Kumar Dhanagopal | Cross-Product Solution Developer
- Samantha He | Technical Writer