Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Ringkasan

Model Armor terintegrasi dengan Google Cloud layanan untuk mengamankan interaksi AI dan model bahasa besar (LLM). Model Armor mengidentifikasi dan melaporkan potensi pelanggaran kebijakan serta dapat secara aktif memblokir tindakan berdasarkan evaluasi keamanan.

Modalitas yang didukung

Dalam integrasi Model Armor dengan layanan Google Cloud lainnya, Model Armor hanya memindai dan menganalisis input dan output berbasis teks ke dan dari LLM, agen, dan Google Cloud server MCP. Modalitas lain tidak dipindai, kecuali dokumen dalam integrasi Gemini Enterprise. Untuk mengetahui detail tentang jenis dokumen yang didukung, lihat Penyaringan dokumen.

Layanan yang didukung

Bagian ini menjelaskan layanan Google Cloud yang dapat Anda integrasikan dengan Model Armor.

Agent Gateway

Integrasikan Model Armor dengan Agent Gateway untuk menerapkan kebijakan keamanan pada traffic yang masuk dan keluar dari semua agen yang diatur oleh gateway. Integrasi ini memungkinkan pemeriksaan dan pemblokiran inline terhadap konten berbahaya atau tidak mematuhi kebijakan. Integrasi ini bertujuan untuk meningkatkan keamanan alur kerja dan kepatuhan terhadap pedoman keselamatan organisasi, tanpa perlu memodifikasi kode aplikasi. Perlindungan ini berlaku untuk protokol yang didukung di jalur masuk (ke agen) dan keluar (dari agen). Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan Agent Gateway.

Apigee

Integrasi ini memungkinkan Anda menggunakan kemampuan perlindungan AI Model Armor langsung dalam lapisan gateway API Apigee. Anda mengonfigurasi kebijakan Model Armor tertentu dalam proxy API Apigee. Saat panggilan API melewati proxy Apigee yang memiliki kebijakan ini, Apigee akan mengirimkan perintah dan respons ke layanan Model Armor untuk diperiksa. Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan Apigee.

Gemini Enterprise

Model Armor dapat diintegrasikan langsung dengan Gemini Enterprise menggunakan template. Gemini Enterprise merutekan interaksi antara pengguna dan agen serta LLM yang mendasarinya melalui Model Armor. Artinya, perintah dari pengguna atau agen dan respons yang dihasilkan oleh LLM diperiksa oleh Model Armor sebelum ditampilkan kepada pengguna. Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan Gemini Enterprise.

Selain modalitas yang tercantum di Modalitas yang didukung, integrasi Model Armor dengan Gemini Enterprise juga mendukung dokumen. Namun, gambar yang disematkan dalam dokumen tidak disaring.

Server MCP dan Google Cloud Google

Model Armor dapat dikonfigurasi untuk membantu melindungi data Anda dan mengamankan konten saat mengirim permintaan ke layanan Google Cloud yang mengekspos alat dan server Model Context Protocol (MCP). Model Armor membantu mengamankan aplikasi AI agentic Anda dengan membersihkan panggilan dan respons alat MCP menggunakan setelan batas bawah. Proses ini memitigasi risiko seperti injeksi perintah dan pengungkapan data sensitif. Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan server Google dan MCP. Google Cloud

Service Extensions

Model Armor dapat diintegrasikan dengan Google Cloud layanan jaringan melalui Service Extensions. Service Extensions memungkinkan Anda mengintegrasikan layanan internal (layananGoogle Cloud ) atau eksternal (yang dikelola pengguna) untuk memproses traffic. Anda dapat mengonfigurasi ekstensi layanan di load balancer aplikasi untuk menyaring traffic jaringan untuk berbagai interaksi AI, seperti dengan agen dan server MCP. Anda juga dapat menggunakan ekstensi layanan dengan gateway inferensi GKE untuk menyaring traffic ke dan dari cluster GKE. Hal ini membantu memastikan bahwa semua interaksi AI yang melewati load balancer dilindungi oleh Model Armor. Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan layanan jaringan Google Cloud .

Platform Agen Gemini Enterprise

Model Armor dapat diintegrasikan langsung ke Platform Agen Gemini Enterprise menggunakan setelan batas bawah atau template. Integrasi ini menyaring permintaan dan respons model Gemini, memblokir permintaan dan respons yang melanggar setelan batas minimum. Integrasi ini memberikan perlindungan perintah dan respons dalam Gemini API di Vertex AI untuk metode generateContent. Anda harus mengaktifkan Cloud Logging untuk mendapatkan visibilitas ke dalam hasil pembersihan perintah dan respons. Untuk mengetahui informasi selengkapnya, lihat artikel Mengintegrasikan dengan Platform Agen Gemini Enterprise.

Sebelum memulai

Mengaktifkan API

Anda harus mengaktifkan Model Armor API sebelum dapat menggunakan Model Armor.

Konsol

Aktifkan Model Armor API.
Peran yang diperlukan untuk mengaktifkan API
Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin (roles/serviceusage.serviceUsageAdmin), yang berisi izin serviceusage.services.enable. Pelajari cara memberikan peran.
Mengaktifkan API
Pilih project tempat Anda ingin mengaktifkan Model Armor.

gcloud

Sebelum memulai, ikuti langkah-langkah berikut menggunakan Google Cloud CLI dengan Model Armor API:

Di konsol Google Cloud , aktifkan Cloud Shell.

Aktifkan Cloud Shell

Di bagian bawah konsol Google Cloud , sesi Cloud Shell akan dimulai dan menampilkan perintah command line. Cloud Shell adalah lingkungan shell dengan Google Cloud CLI yang sudah terinstal, dan dengan nilai yang sudah ditetapkan untuk project Anda saat ini. Diperlukan waktu beberapa detik untuk melakukan inisialisasi pada sesi.
Tetapkan penggantian endpoint API menggunakan gcloud CLI.

Menetapkan penggantian endpoint API menggunakan gcloud CLI

Langkah ini hanya diperlukan jika Anda menggunakan gcloud CLI untuk mengaktifkan Model Armor API. Anda harus menetapkan penggantian endpoint API secara manual untuk memastikan gcloud CLI merutekan permintaan dengan benar ke layanan Model Armor.

Jalankan perintah berikut untuk menetapkan endpoint API bagi layanan Model Armor.

gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"

Ganti LOCATION dengan region tempat Anda ingin menggunakan Model Armor.

Kelola kuota

Model Armor menggunakan sistem kuota untuk memastikan penggunaan yang adil dan melindungi stabilitas sistem. Kuota default untuk Model Armor API adalah 1.200 QPM per project. Anda dapat menerapkan nilai antara 0 hingga 1.200 QPM per project. Untuk meminta penyesuaian, lihat Meminta penyesuaian kuota. Jika Anda memerlukan kuota yang lebih besar dari kuota default, hubungi Cloud Customer Care.

Kuota Model Armor memerlukan pertimbangan penting saat diintegrasikan dengan layanan lain. Kuota utama yang Anda gunakan adalah jumlah permintaan API per menit per project.

Kuota default Model Armor: Saat layanan melakukan panggilan ke Model Armor API untuk analisis (misalnya, memeriksa perintah atau respons), hal ini akan menggunakan kuota Model Armor API project Anda.
Kuota layanan yang terintegrasi: Kuota Model Armor terpisah dari kuota yang terkait dengan layanan yang terintegrasi. Anda harus memastikan ada kuota yang cukup untuk semua layanan di jalur permintaan Anda. Setiap panggilan yang dilakukan ke Model Armor API untuk membersihkan konten aplikasi Anda dihitung berdasarkan batas kuota Model Armor API.

Menemukan situasi di luar kuota

Anda mencapai batas kuota Model Armor jika log aplikasi Anda menampilkan error dari Model Armor, biasanya error HTTP 429 RESOURCE_EXHAUSTED, yang menunjukkan terlalu banyak permintaan.

Memperkirakan kebutuhan kuota

Untuk menentukan jumlah kuota Model Armor yang akan diminta:

Perkirakan jumlah puncak permintaan per menit yang akan dikirim layanan Anda ke Model Armor.
Pertimbangkan berapa kali Model Armor dipanggil per interaksi pengguna dengan layanan Anda (misalnya, sekali untuk perintah dan sekali untuk respons).
Perhitungkan jumlah maksimum pengguna atau sesi serentak.
Minta kuota dengan buffer yang wajar (misalnya, 20-30% di atas puncak yang diharapkan) untuk menangani lonjakan yang tidak terduga.
Mulailah dengan perkiraan terbaik Anda, pantau penggunaan secara cermat setelah peluncuran, dan minta penyesuaian lebih lanjut sesuai kebutuhan.

Misalnya, jika Anda memperkirakan ada 500 pengguna per menit, dan setiap interaksi pengguna memanggil Model Armor dua kali (perintah dan respons), Anda memerlukan setidaknya 1.000 QPM. Dengan mempertimbangkan buffer, meminta 1.200-1.300 QPM adalah titik awal yang baik.

Pertimbangan

Pastikan Anda memantau dan mengelola kuota untuk layanan lain. Kehabisan kuota untuk layanan lain akan memengaruhi aplikasi Anda, meskipun Anda memiliki kuota Model Armor yang cukup.
Terapkan percobaan ulang sisi klien dengan backoff eksponensial dalam penyiapan aplikasi Anda untuk menangani masalah kuota sementara atau error lain yang dapat dicoba ulang. Untuk mengetahui informasi selengkapnya, lihat Strategi percobaan ulang.

Melakukan integrasi menggunakan REST API

Saat Anda menggunakan REST API untuk integrasi, Model Armor berfungsi hanya sebagai detektor menggunakan template. Fitur ini mengidentifikasi dan melaporkan potensi pelanggaran kebijakan berdasarkan template yang telah ditentukan sebelumnya, bukan secara aktif mencegahnya. Saat terintegrasi dengan Model Armor API, aplikasi Anda dapat menggunakan output dari Model Armor untuk memblokir atau mengizinkan tindakan berdasarkan hasil evaluasi keamanan yang diberikan. Model Armor API menampilkan informasi tentang potensi ancaman atau pelanggaran kebijakan yang terkait dengan traffic API Anda, terutama dalam kasus interaksi AI. Aplikasi Anda dapat memanggil Model Armor API dan menggunakan informasi yang diterima dalam respons untuk membuat keputusan dan mengambil tindakan berdasarkan logika kustom yang telah ditentukan sebelumnya.

Opsi saat mengintegrasikan Model Armor

Model Armor menawarkan opsi integrasi berikut. Setiap opsi menyediakan fitur dan kemampuan yang berbeda.

Opsi integrasi	Mengonfigurasi deteksi	Hanya periksa	Memeriksa dan memblokir	Cakupan
Gateway Agen (Pratinjau)	Hanya menggunakan template	Ya	Ya	Semua model dan semua cloud
Apigee	Hanya menggunakan template	Ya	Ya	Semua model dan semua cloud²
Gemini Enterprise	Hanya menggunakan template	Ya	Ya	Semua model dan semua cloud²
Server MCP Google dan Google Cloud	Hanya menggunakan setelan minimum	Ya	Ya	Server MCP dan Google Cloud Google
Ekstensi Layanan	Hanya menggunakan template	Ya	Ya	^{Model, agen, dan server MCP format OpenAI di semua cloud^1,2}
Platform Agen Gemini Enterprise	Keduanya menggunakan setelan minimum dan template	Ya	Ya	Model Gemini (non-streaming)

¹Beberapa model populer—termasuk Anthropic Claude, Mistral AI, dan Grok—mendukung spesifikasi OpenAI. Model ini biasanya di-deploy menggunakan mesin inferensi seperti vLLM, yang menyediakan lapisan API yang kompatibel dengan OpenAI yang diperlukan. vLLM mendukung berbagai model, termasuk seri Meta Llama, DeepSeek, Mistral dan Mixtral, serta Gemma.

²Mencakup cloud publik lainnya seperti AWS dan Azure.

Dengan opsi integrasi Platform Agen Gemini Enterprise, Model Armor memberikan penegakan inline menggunakan setelan atau template batas bawah. Artinya, Model Armor secara aktif menerapkan kebijakan dengan melakukan intervensi langsung dalam proses tanpa memerlukan modifikasi pada kode aplikasi Anda.

Integrasi Ekstensi Layanan dan Gemini Enterprise hanya menggunakan template untuk penegakan kebijakan inline. Artinya, Model Armor dapat menerapkan kebijakan secara langsung tanpa mengharuskan Anda mengubah kode aplikasi baik dalam Ekstensi Layanan maupun selama interaksi pengguna atau agen dalam instance Gemini Enterprise.

Integrasi Model Armor dan Gemini Enterprise hanya menyaring perintah pengguna awal dan respons akhir agen atau model. Langkah-langkah perantara yang terjadi antara perintah pengguna awal dan pembuatan respons akhir tidak tercakup dalam integrasi ini.

Model Armor di Security Command Center

Model Armor memeriksa perintah dan respons LLM untuk mendeteksi berbagai ancaman, termasuk injeksi perintah, upaya jailbreak, URL berbahaya, dan konten berbahaya. Jika Model Armor mendeteksi pelanggaran terhadap setelan batas bawah yang dikonfigurasi, Model Armor akan memblokir perintah atau respons dan mengirimkan temuan ke Security Command Center. Untuk mengetahui informasi selengkapnya, lihat Temuan Model Armor.