Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Ringkasan

Model Armor terintegrasi dengan Google Cloud layanan untuk mengamankan interaksi AI dan model bahasa besar (LLM). Model Armor mengidentifikasi dan melaporkan potensi pelanggaran kebijakan serta dapat memblokir tindakan secara aktif berdasarkan evaluasi keamanan.

Modalitas yang didukung

Dalam integrasi Model Armor dengan layanan lain Google Cloud Model Armor hanya memindai dan menganalisis input dan output berbasis teks ke dan dari LLM, agen, dan Google Cloud server MCP. Modalitas lainnya tidak dipindai, kecuali dokumen dalam integrasi Gemini Enterprise. Untuk mengetahui detail jenis dokumen yang didukung, lihat Pemindaian dokumen.

Layanan yang didukung

Bagian ini menjelaskan Google Cloud layanan yang dapat Anda integrasikan dengan Model Armor.

Agent Gateway

Integrasikan Model Armor dengan Agent Gateway untuk menerapkan kebijakan keamanan pada traffic yang mengalir ke dan dari semua agen yang dikelola oleh gateway. Integrasi ini memungkinkan pemeriksaan dan pemblokiran konten berbahaya atau yang tidak sesuai secara langsung. Integrasi ini bertujuan untuk meningkatkan keamanan alur kerja dan kepatuhan terhadap panduan keselamatan organisasi, tanpa perlu melakukan modifikasi pada kode aplikasi. Perlindungan ini berlaku untuk protokol yang didukung pada jalur masuk (ke agen) dan keluar (dari agen). Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan Agent Gateway.

Apigee

Integrasi Model Armor dan Apigee memungkinkan Anda menggunakan kemampuan perlindungan AI Model Armor langsung dalam lapisan gateway API Apigee. Anda mengonfigurasi kebijakan Model Armor tertentu dalam proxy API Apigee. Saat panggilan API melewati proxy Apigee yang memiliki kebijakan ini, Apigee akan mengirimkan perintah dan respons ke layanan Model Armor untuk diperiksa. Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan Apigee.

Gemini Enterprise

Model Armor dapat diintegrasikan langsung dengan Gemini Enterprise menggunakan template. Gemini Enterprise merutekan interaksi antara pengguna dan agen serta LLM yang mendasarinya melalui Model Armor. Artinya, perintah dari pengguna atau agen dan respons yang dihasilkan oleh LLM diperiksa oleh Model Armor sebelum ditampilkan kepada pengguna. Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan Gemini Enterprise.

Selain modalitas yang tercantum di Modalitas yang didukung, integrasi Model Armor dengan Gemini Enterprise juga mendukung dokumen. Namun, gambar yang disematkan dalam dokumen tidak dipindai.

Server Google dan Google Cloud MCP

Model Armor dapat dikonfigurasi untuk membantu melindungi data dan mengamankan konten Anda saat mengirim permintaan ke Google Cloud layanan yang mengekspos alat dan server Model Context Protocol (MCP). Model Armor membantu mengamankan aplikasi AI agentic Anda dengan membersihkan panggilan dan respons alat MCP menggunakan setelan minimum. Proses ini mengurangi risiko seperti injeksi perintah dan pengungkapan data sensitif. Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan server Google dan{/}MCP. Google Cloud

Service Extensions

Model Armor dapat diintegrasikan dengan Google Cloud layanan jaringan melalui Service Extensions. Service Extensions memungkinkan Anda mengintegrasikan Google Cloud layanan atau layanan yang dikelola pengguna untuk memproses traffic. Anda dapat mengonfigurasi ekstensi layanan di load balancer aplikasi untuk memindai traffic jaringan untuk berbagai interaksi AI, seperti dengan agen dan server MCP. Anda juga dapat menggunakan ekstensi layanan dengan gateway inferensi GKE untuk memindai traffic ke dan dari cluster GKE. Tindakan ini membantu memastikan bahwa semua interaksi AI yang melewati load balancer dilindungi oleh Model Armor. Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan Google Cloud layanan jaringan.

Gemini Enterprise Agent Platform

Model Armor dapat diintegrasikan langsung ke Gemini Enterprise Agent Platform menggunakan setelan tingkat atau template. Integrasi ini memindai permintaan dan respons model Gemini, serta memblokir permintaan dan respons yang melanggar setelan minimum. Integrasi ini memberikan perlindungan perintah dan respons dalam Gemini API di Vertex AI untuk metode generateContent. Anda harus mengaktifkan Cloud Logging untuk mendapatkan visibilitas ke hasil sanitasi perintah dan respons. Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan Gemini Enterprise Agent Platform.

Sebelum memulai

Mengaktifkan API

Anda harus mengaktifkan Model Armor API sebelum dapat menggunakan Model Armor.

Konsol

Aktifkan Model Armor API.
Peran yang diperlukan untuk mengaktifkan API
Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin (roles/serviceusage.serviceUsageAdmin), yang berisi izin serviceusage.services.enable. Pelajari cara memberikan peran.
Mengaktifkan API
Pilih project tempat Anda ingin mengaktifkan Model Armor.

gcloud

Sebelum memulai, ikuti langkah-langkah berikut menggunakan Google Cloud CLI dengan Model Armor API:

Di konsol, aktifkan Cloud Shell. Google Cloud

Aktifkan Cloud Shell

Di bagian bawah konsol Google Cloud , sesi Cloud Shell akan dimulai dan menampilkan prompt command line. Cloud Shell adalah lingkungan shell dengan Google Cloud CLI yang sudah terinstal, dan dengan nilai yang sudah ditetapkan untuk project Anda saat ini. Diperlukan waktu beberapa detik untuk melakukan inisialisasi pada sesi.
Tetapkan penggantian endpoint API menggunakan gcloud CLI.

Menetapkan penggantian endpoint API menggunakan gcloud CLI

Langkah ini hanya diperlukan jika Anda menggunakan gcloud CLI untuk mengaktifkan Model Armor API. Anda harus menetapkan penggantian endpoint API secara manual untuk memastikan gcloud CLI merutekan permintaan ke layanan Model Armor dengan benar.

Jalankan perintah berikut untuk menetapkan endpoint API untuk layanan Model Armor.

gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"

Ganti LOCATION dengan region tempat Anda ingin menggunakan Model Armor.

Mengelola kuota

Model Armor menggunakan sistem kuota untuk memastikan penggunaan yang adil dan melindungi stabilitas sistem. Kuota default untuk Model Armor API adalah 1.200 QPM per project. Anda dapat menerapkan nilai dari 0 hingga 1.200 QPM per project. Untuk meminta penyesuaian, lihat Meminta penyesuaian kuota. Jika Anda memerlukan kuota lebih dari kuota default, hubungi Cloud Customer Care.

Kuota Model Armor memerlukan pertimbangan penting saat diintegrasikan dengan layanan lain. Kuota utama yang Anda gunakan adalah jumlah permintaan API per menit per project.

Pertimbangkan jenis kuota berikut saat mengintegrasikan Model Armor dengan layanan lain.

Kuota default Model Armor: Saat layanan melakukan panggilan ke Model Armor API untuk analisis (misalnya, memeriksa perintah atau respons), hal ini akan menggunakan kuota Model Armor API project Anda.
Kuota layanan integrasi: Kuota Model Armor terpisah dari kuota yang terkait dengan layanan integrasi. Anda harus memastikan ada kuota yang cukup untuk semua layanan di jalur permintaan Anda. Setiap panggilan yang dilakukan ke Model Armor API untuk membersihkan konten aplikasi Anda akan dihitung terhadap batas kuota Model Armor API.

Menemukan situasi di luar kuota

Anda mencapai batas kuota Model Armor jika log aplikasi Anda menampilkan error dari Model Armor, biasanya error HTTP 429 RESOURCE_EXHAUSTED, yang menunjukkan terlalu banyak permintaan.

Memperkirakan kebutuhan kuota

Untuk menentukan jumlah kuota Model Armor yang akan diminta:

Perkirakan jumlah permintaan puncak per menit yang akan dikirimkan layanan Anda ke Model Armor.
Pertimbangkan berapa kali Model Armor dipanggil per interaksi pengguna dengan layanan Anda (misalnya, sekali untuk perintah dan sekali untuk respons).
Faktorkan jumlah maksimum pengguna atau sesi serentak.
Minta kuota dengan buffer yang wajar (misalnya, 20-30% di atas puncak yang diharapkan) untuk menangani lonjakan yang tidak terduga.
Mulai dengan perkiraan terbaik Anda, pantau penggunaan dengan cermat setelah peluncuran, dan minta penyesuaian lebih lanjut jika diperlukan.

Misalnya, jika Anda mengharapkan 500 pengguna per menit, dan setiap interaksi pengguna memanggil Model Armor dua kali (perintah dan respons), Anda memerlukan setidaknya 1.000 QPM. Dengan mempertimbangkan buffer, meminta 1.200-1.300 QPM adalah titik awal yang baik.

Pertimbangan

Saat berintegrasi dengan layanan lain, pertimbangkan hal berikut:

Pastikan Anda memantau dan mengelola kuota untuk layanan lain. Kehabisan kuota untuk layanan lain akan memengaruhi aplikasi Anda, meskipun Anda memiliki kuota Model Armor yang cukup.
Terapkan percobaan ulang sisi klien dengan backoff eksponensial dalam penyiapan aplikasi Anda untuk menangani masalah kuota sementara atau error lain yang dapat dicoba ulang. Untuk mengetahui informasi selengkapnya, lihat Strategi percobaan ulang.

Jenis penegakan

Saat mengintegrasikan Model Armor dengan layanan lain, aspek penting yang perlu dikonfigurasi adalah jenis penegakan. Setelan ini menentukan cara Model Armor bertindak saat mendeteksi potensi pelanggaran kebijakan dalam data yang diperiksanya, seperti perintah atau respons LLM. Jenis penegakan menentukan apakah Model Armor hanya melaporkan pelanggaran atau melakukan intervensi secara aktif. Untuk mengetahui informasi selengkapnya, lihat Menentukan jenis penegakan.

Mengintegrasikan menggunakan REST API

Saat Anda menggunakan REST API untuk integrasi, Model Armor hanya berfungsi sebagai detektor menggunakan template. Model Armor mengidentifikasi dan melaporkan potensi pelanggaran kebijakan berdasarkan template yang telah ditentukan sebelumnya, bukan mencegahnya secara aktif. Saat berintegrasi dengan Model Armor API, aplikasi Anda dapat menggunakan output dari Model Armor untuk memblokir atau mengizinkan tindakan berdasarkan hasil evaluasi keamanan yang diberikan. Model Armor API menampilkan informasi tentang potensi ancaman atau pelanggaran kebijakan terkait traffic API Anda, terutama dalam kasus interaksi AI. Aplikasi Anda dapat memanggil Model Armor API dan menggunakan informasi yang diterima dalam respons untuk membuat keputusan dan mengambil tindakan berdasarkan logika kustom yang telah ditentukan sebelumnya.

Opsi saat mengintegrasikan Model Armor

Model Armor menawarkan opsi integrasi berikut. Setiap opsi menyediakan fitur dan kemampuan yang berbeda.

Opsi integrasi	Mengonfigurasi deteksi	Hanya memeriksa	Memeriksa dan memblokir	Cakupan
Agent Gateway (Pratinjau)	Hanya menggunakan template	Ya	Ya	Semua model dan semua cloud
Apigee	Hanya menggunakan template	Ya	Ya	Semua model dan semua clouds²
Gemini Enterprise	Hanya menggunakan template	Ya	Ya	Semua model dan semua clouds²
Server Google dan Google Cloud MCP	Hanya menggunakan setelan minimum	Ya	Ya	Server Google dan Google Cloud MCP
Service Extensions	Hanya menggunakan template	Ya	Ya	Model format OpenAI¹, agen, dan server MCP di semua cloud²
Gemini Enterprise Agent Platform	Menggunakan setelan tingkat dan template	Ya	Ya	Model Gemini (non-streaming)

¹Beberapa model populer—termasuk Anthropic Claude, Mistral AI, dan Grok—mendukung spesifikasi OpenAI. Model ini biasanya di-deploy menggunakan mesin inferensi seperti vLLM, yang menyediakan lapisan API yang kompatibel dengan OpenAI. vLLM mendukung berbagai model, termasuk seri Meta Llama, DeepSeek, Mistral dan Mixtral, serta Gemma.

²Mencakup cloud publik lainnya seperti AWS dan Azure.

Dengan opsi integrasi Gemini Enterprise Agent Platform, Model Armor menyediakan penegakan inline menggunakan setelan minimum atau template. Artinya, Model Armor secara aktif menerapkan kebijakan dengan melakukan intervensi langsung dalam proses tanpa memerlukan modifikasi pada kode aplikasi Anda.

Integrasi Service Extensions dan Gemini Enterprise hanya menggunakan template untuk penegakan kebijakan inline. Artinya, Model Armor dapat menerapkan kebijakan secara langsung tanpa mengharuskan Anda mengubah kode aplikasi baik dalam Service Extensions maupun selama interaksi pengguna atau agen dalam instance Gemini Enterprise.

Integrasi Model Armor dan Gemini Enterprise hanya membersihkan perintah awal pengguna dan respons agen atau model akhir. Langkah-langkah perantara yang terjadi antara perintah awal pengguna dan pembuatan respons akhir tidak tercakup dalam integrasi ini.

Model Armor di Security Command Center

Model Armor memeriksa perintah dan respons LLM untuk berbagai ancaman, termasuk injeksi perintah, upaya jailbreak, URL berbahaya, dan konten berbahaya. Saat Model Armor mendeteksi pelanggaran setelan minimum yang dikonfigurasi, Model Armor akan memblokir perintah atau respons dan mengirimkan temuan ke Security Command Center. Untuk mengetahui informasi selengkapnya, lihat Temuan Model Armor.

Ringkasan Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.