Model Armor adalah layanan yang dirancang untuk meningkatkan keamanan dan keselamatan aplikasi AI Anda, terutama yang menggunakan Model Bahasa Besar (LLM). Google Cloud Fitur ini berfungsi dengan memeriksa perintah yang dikirim ke model Anda dan respons yang dihasilkan olehnya, sehingga membantu Anda memitigasi risiko dan menerapkan praktik AI yang bertanggung jawab.
Mengonfigurasi template
Tentukan cara Model Armor harus menyaring konten dengan membuat dan menggunakan template Model Armor. Template adalah set konfigurasi yang dapat digunakan kembali tempat Anda menentukan filter yang akan diaktifkan, tingkat keyakinan untuk filter, dan jenis penerapan untuk setiap filter. Untuk mengetahui informasi selengkapnya, lihat Membuat dan mengelola template.
Mengonfigurasi setelan minimum
Untuk memastikan tingkat perlindungan dasar, administrator keamanan dapat mengonfigurasi setelan minimum di tingkat organisasi, folder, atau project. Setelan ini mewajibkan persyaratan filter minimum yang harus dipatuhi oleh semua template Model Armor yang dibuat dalam cakupan tersebut, sehingga membantu mencegah konfigurasi yang terlalu permisif. Untuk mengetahui informasi selengkapnya, lihat Mengonfigurasi setelan lantai.
Menyaring perintah dan respons
Saat pengguna mengirimkan perintah ke aplikasi Anda, aplikasi Anda akan mengirimkan perintah ini terlebih dahulu ke Model Armor. Model Armor memproses perintah melalui filter yang diaktifkan dalam template dan menampilkan respons yang menunjukkan apakah ada pelanggaran kebijakan yang ditemukan dan hasil mendetail dari setiap filter. Logika aplikasi Anda kemudian memutuskan tindakan selanjutnya yang harus dilakukan.
Saat LLM menghasilkan respons, sebelum menampilkan respons ini kepada pengguna, aplikasi Anda akan mengirimkannya ke Model Armor. Model Armor memeriksa output LLM menggunakan konfigurasi filter yang ditentukan dalam template dan menampilkan hasil analisis. Aplikasi Anda kemudian memutuskan apakah akan menampilkan respons kepada pengguna, dan berpotensi memblokirnya jika ditemukan pelanggaran.
Untuk mengetahui informasi selengkapnya, lihat Membersihkan perintah dan respons.