Integrasi Model Armor dengan Vertex AI

Model Armor dapat diintegrasikan langsung ke Vertex AI baik menggunakan setelan batas bawah maupun menggunakan template. Model Armor terintegrasi dengan Vertex AI untuk menyaring permintaan yang dikirim ke dan respons yang diterima dari model Gemini. Memeriksa atau memblokir traffic yang melanggar setelan batas bawah.

Model Armor memberikan perlindungan perintah dan respons dalam Gemini API di Vertex AI untuk metode generateContent. Anda harus mengaktifkan Cloud Logging untuk mendapatkan visibilitas ke hasil pembersihan perintah dan respons.

Sebelum memulai

Berikan izin pengguna Model Armor ke akun layanan Vertex AI.

gcloud projects add-iam-policy-binding PROJECT_ID --member='serviceAccount:service-PROJECT_NUMBER@gcp-sa-aiplatform.iam.gserviceaccount.com' --role='roles/modelarmor.user'

Ganti kode berikut:

PROJECT_ID: Google Cloud Project ID Anda.
PROJECT_NUMBER: nomor project Google Cloud Anda.

Mengonfigurasi setelan minimum

Anda menggunakan setelan minimum untuk mengonfigurasi nilai minimum deteksi untuk template Model Armor. Setelan ini memverifikasi bahwa semua template baru dan yang diubah memenuhi persyaratan setelan harga minimum.

Untuk mengaktifkan integrasi Model Armor dan Vertex AI, Anda dapat menetapkan setelan batas bawah hanya di tingkat project menggunakan API atau konsol Google Cloud .

Untuk mengonfigurasi setelan lantai, lihat Mengonfigurasi setelan lantai.

Untuk mengonfigurasi setelan lantai dengan integrasi Vertex AI, jalankan perintah berikut:

gcloud

gcloud model-armor floorsettings update \
  --full-uri=projects/PROJECT_ID/locations/global/floorSetting \
  --add-integrated-services=VERTEX_AI

Perintah ini mengaktifkan mode penerapan INSPECT_ONLY secara default. Untuk mengubah mode ke INSPECT_AND_BLOCK, jalankan perintah berikut:

gcloud model-armor floorsettings update \
  --full-uri=projects/PROJECT_ID/locations/global/floorSetting \
  --vertex-ai-enforcement-type=INSPECT_AND_BLOCK

Untuk menghapus Vertex AI dari layanan terintegrasi, jalankan perintah berikut:

gcloud model-armor floorsettings update \
  --full-uri=projects/PROJECT_ID/locations/global/floorSetting \
  --remove-integrated-services=VERTEX_AI

Untuk menghapus semua layanan terintegrasi yang dikonfigurasi dari setelan lantai, gunakan perintah berikut:

gcloud model-armor floorsettings update \
  --full-uri=projects/PROJECT_ID/locations/global/floorSetting \
  --clear-integrated-services

Ganti PROJECT_ID dengan ID project untuk setelan lantai.

REST

curl -X PATCH \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -d '{"filterConfig" : {}, "integratedServices": "AI_PLATFORM", "aiPlatformFloorSetting":{"inspect_only":true, "enableCloudLogging":true}}' \
    "https://modelarmor.googleapis.com/v1/projects/PROJECT_ID/locations/global/floorSetting"

Ganti PROJECT_ID dengan ID project untuk setelan lantai.

Setelah mengonfigurasi setelan batas bawah untuk mengaktifkan sanitasi Vertex AI, Model Armor akan menyanitasi semua panggilan API generateContent ke endpoint Gemini project menggunakan setelan filter yang ditentukan.

Contoh kode berikut menunjukkan cara menggunakan metode generateContent.

curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/gemini-2.0-flash-001:generateContent" -d '{
"contents": [
  {
      "role": "user",
      "parts": [
          {
              "text": ""
          }
      ]
  }
]
, "generationConfig": {
  "responseModalities": ["TEXT"]
  ,"temperature": 0.2
  ,"maxOutputTokens": 1024
  ,"topP": 0.8
}
}'

Ganti kode berikut:

PROJECT_ID: Google Cloud Project ID Anda.
LOCATION: Google Cloud lokasi endpoint Gemini. Untuk lokasi yang didukung, lihat Lokasi untuk Model Armor API.

Contoh kode berikut menunjukkan respons dari metode generateContent.

{
"promptFeedback": {
  "blockReason": "MODEL_ARMOR",
  "blockReasonMessage": "Blocked by Floor Setting. The prompt violated Responsible AI Safety settings (Harassment, Dangerous), Prompt Injection and Jailbreak filters."
},
"usageMetadata": {
  "trafficType": "ON_DEMAND"
},
"modelVersion": "gemini-2.0-flash-001",
"createTime": "2025-03-26T13:14:36.961184Z",
"responseId": "vP3jZ6DVOqLKnvgPqZL-8Ao"
}

Menentukan jenis penegakan untuk setelan lantai

Untuk mengonfigurasi cara Model Armor menangani deteksi, tetapkan jenis penegakan. Contoh berikut menunjukkan konfigurasi setelan lantai dengan jenis penerapan INSPECT_AND_BLOCK.

gcloud

gcloud model-armor floorsettings update \
  --full-uri=projects/modelarmor-api-test/locations/global/floorSetting \
  --vertex-ai-enforcement-type=INSPECT_AND_BLOCK

REST

export FLOOR_SETTING='{
  "filter_config": {
    "rai_settings": {
      "rai_filters": {
        "filter_type": "HATE_SPEECH",
        "confidence_level": "LOW_AND_ABOVE"
      },
      "rai_filters": {
        "filter_type": "DANGEROUS",
        "confidence_level": "LOW_AND_ABOVE"
      },
    "rai_filters": {
        "filter_type": "SEXUALLY_EXPLICIT",
        "confidence_level": "LOW_AND_ABOVE"
      },
      "rai_filters": {
        "filter_type": "HARASSMENT",
        "confidence_level": "LOW_AND_ABOVE"
      }
    },
    "sdpSettings": {
      "basicConfig": {
        "filterEnforcement": "ENABLED"
      }
    },
    "piAndJailbreakFilterSettings": {
      "filterEnforcement": "ENABLED",
      "confidenceLevel": "LOW_AND_ABOVE"
    },
    "maliciousUriFilterSettings": {
      "filterEnforcement": "ENABLED"
    }
  },
  "integratedServices": [
      "AI_PLATFORM"
  ],
  "aiPlatformFloorSetting": {
    "inspectAndBlock": true,
    "enableCloudLogging": true
  },
  "enable_floor_setting_enforcement": "true"
}'

curl -X POST \
    -d "$FLOOR_SETTING"  \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    "https://modelarmor.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/floorSetting"

Ganti kode berikut:

PROJECT_ID: ID project untuk setelan lantai.
LOCATION: lokasi setelan minimum.

Mengonfigurasi template Model Armor

Model Armor juga dapat diintegrasikan dengan Vertex AI menggunakan template Model Armor. Template memungkinkan Anda mengonfigurasi cara Model Armor menyaring perintah dan respons serta menentukan konfigurasi filter keamanan.

Anda harus membuat template terlebih dahulu, lalu menggunakan template ini dengan metode generateContent Gemini. Untuk mengetahui informasi selengkapnya tentang template, lihat Membuat dan mengelola template Model Armor.

Setelah mengonfigurasi template Model Armor, teruskan ID template sebagai parameter saat melakukan panggilan ke Gemini API menggunakan metode generateContent. Vertex AI akan merutekan permintaan ke Model Armor untuk diproses.

Contoh kode berikut menunjukkan permintaan ke metode generateContent.

curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://{LOCATION}-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/{LOCATION}/publishers/google/models/gemini-2.0-flash-001:generateContent" -d '{
"contents": [
    {
        "role": "user",
        "parts": [
            {
                "text": ""
            }
        ]
    }
]
, "generationConfig": {
    "responseModalities": ["TEXT"]
    ,"temperature": 0.2
    ,"maxOutputTokens": 1024
    ,"topP": 0.8
},
 "model_armor_config": {
        "prompt_template_name": "projects/PROJECT_ID/locations/LOCATION/templates/TEMPLATE_ID",
"response_template_name": "projects/PROJECT_ID/locations/LOCATION/templates/TEMPLATE_ID"
    }
}'

Ganti kode berikut:

PROJECT_ID: Google Cloud Project ID
LOCATION: Google Cloud lokasi endpoint Gemini. Lokasi yang didukung adalah us-central1, us-east4, us-west1, dan europe-west4.
TEMPLATE_ID: ID template Model Armor.

Contoh kode berikut menunjukkan respons dari metode generateContent.

{
  "promptFeedback": {
    "blockReason": "MODEL_ARMOR",
    "blockReasonMessage": "Blocked by Floor Setting. The prompt violated Responsible AI Safety settings (Harassment, Dangerous), Prompt Injection and Jailbreak filters."
  },
  "usageMetadata": {
    "trafficType": "ON_DEMAND"
  },
  "modelVersion": "gemini-2.0-flash-001",
  "createTime": "2025-03-26T13:14:36.961184Z",
  "responseId": "vP3jZ6DVOqLKnvgPqZL-8Ao"
}

Prioritas konfigurasi

Saat menggunakan Model Armor dengan Vertex AI, konfigurasi keamanan dapat ditentukan di beberapa tingkat. Dalam kasus tersebut, Model Armor dan Vertex AI mengikuti urutan prioritas tertentu:

Template Model Armor: Konfigurasi apa pun yang secara eksplisit diberikan dalam konfigurasi yang ditentukan dalam permintaan API akan memiliki prioritas tertinggi. Setelan ini menggantikan konfigurasi lain yang bertentangan untuk permintaan tertentu tersebut.
Setelan minimum Model Armor: Jika tidak ada konfigurasi penggantian yang diberikan dalam permintaan API, setelan minimum Model Armor akan diterapkan.
Filter keamanan Vertex AI: Filter keamanan default yang dibuat di Vertex AI memiliki prioritas terendah. Setelan ini hanya diterapkan jika tidak ada template atau setelan batas bawah Model Armor tertentu yang ditentukan.

Pendekatan hierarkis ini memberikan kombinasi standar minimum yang luas dan berlaku di seluruh organisasi (menggunakan setelan dasar) dan kontrol per permintaan (menggunakan template), sekaligus memanfaatkan fitur keamanan bawaan Vertex AI sebagai dasar.

Pertimbangan

Pertimbangkan hal-hal berikut saat mengintegrasikan Model Armor dengan Vertex AI:

Penyensoran Sensitive Data Protection untuk template de-identifikasi tidak didukung.
Pembersihan perintah dan respons yang berisi dokumen tidak didukung.
Vertex AI melewati langkah pembersihan Model Armor dan terus memproses permintaan dalam kondisi berikut:
- Model Armor tidak tersedia di region tempat Vertex AI berada.
- Model Armor tidak dapat dijangkau untuk sementara.
- Terjadi error dalam Model Armor.
Semua instance ini terkadang dapat memunculkan perintah atau respons yang tidak disaring karena permintaan berlanjut tanpa pembersihan perintah dan respons.

Integrasi Model Armor dengan Vertex AI Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Sebelum memulai

Mengonfigurasi setelan minimum

gcloud

REST

Menentukan jenis penegakan untuk setelan lantai

gcloud

REST

Mengonfigurasi template Model Armor

Prioritas konfigurasi

Pertimbangan

Integrasi Model Armor dengan Vertex AI