Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

總覽

Model Armor 會與 Google Cloud 服務整合，確保 AI 和大型語言模型 (LLM) 互動安全無虞。Model Armor 會找出並回報潛在的政策違規行為，並根據安全性評估結果主動封鎖動作。

支援的模態

在 Model Armor 與其他 Google Cloud 服務的整合中，Model Armor 只會掃描及分析 LLM、代理程式和 Google Cloud MCP 伺服器之間以文字為基礎的輸入和輸出內容。系統不會掃描其他模式，但 Gemini Enterprise 整合中的文件除外。如要瞭解支援的檔案類型，請參閱「文件篩選」一文。

支援的服務

本節說明可與 Model Armor 整合的 Google Cloud 服務。

Agent Gateway

將 Model Armor 與 Agent Gateway 整合，對流向及來自閘道控管的所有代理程式流量強制執行安全政策。這項整合機制可讓您直接檢查及封鎖惡意或不符規定的內容。這項整合功能旨在提升工作流程安全性，並確保符合機構安全防護規範，且無須修改應用程式程式碼。這項保護措施適用於進入 (傳輸至代理程式) 和離開 (從代理程式傳輸) 路徑的支援通訊協定。詳情請參閱「整合 Agent Gateway」。

Apigee

整合後，您就能直接在 Apigee API Gateway 層使用 Model Armor 的 AI 防護功能。您可以在 Apigee API Proxy 中設定特定 Model Armor 政策。當 API 呼叫通過具有這些政策的 Apigee Proxy 時，Apigee 會將提示和回覆傳送至 Model Armor 服務進行檢查。詳情請參閱「與 Apigee 整合」。

Gemini Enterprise

您可以使用範本，將 Model Armor 直接整合至 Gemini Enterprise。Gemini Enterprise 會透過 Model Armor，將使用者與代理程式和基礎 LLM 之間的互動路徑導向。也就是說，在向使用者顯示提示或代理程式的提示，以及 LLM 生成的回覆之前，Model Armor 會先檢查這些內容。詳情請參閱「與 Gemini Enterprise 整合」。

除了「支援的模態」一節列出的模態，Model Armor 與 Gemini Enterprise 的整合功能也支援文件。不過，系統不會檢查文件中嵌入的圖片。

Google 和 Google Cloud MCP 伺服器

設定 Model Armor，有助於在傳送要求至公開 Model Context Protocol (MCP) 工具和伺服器的 Google Cloud 服務時，保護資料和確保內容安全。Model Armor 會使用底限設定，清除 MCP 工具呼叫和回應，協助保護代理式 AI 應用程式。這個程序可降低提示詞注入和私密/機密資料揭露等風險。詳情請參閱「與 Google 和 MCP 伺服器整合」。 Google Cloud

Service Extensions

Model Armor 可透過 Service Extensions 與網路服務整合。 Google Cloud Service Extensions 可讓您整合內部 (Google Cloud 服務) 或外部 (使用者代管) 服務，以處理流量。您可以在應用程式負載平衡器上設定服務擴充功能，篩選各種 AI 互動的網路流量，例如與代理程式和 MCP 伺服器的互動。您也可以搭配 GKE 推論閘道使用 Service Extensions，篩選往返 GKE 叢集的流量。這有助於確保通過負載平衡器的所有 AI 互動都受到 Model Armor 保護。詳情請參閱「與 Google Cloud 網路服務整合」。

Gemini Enterprise Agent Platform

您可以透過底限設定或範本，將 Model Armor 直接整合至 Gemini Enterprise Agent Platform。這項整合功能會篩選 Gemini 模型的要求和回覆，並封鎖違反底限設定的內容。這項整合功能會在 Vertex AI 的 Gemini API 中，為 generateContent 方法提供提示和回覆保護機制。您必須啟用 Cloud Logging，才能查看提示和回覆的清除結果。詳情請參閱「與 Gemini Enterprise Agent Platform 整合」。

事前準備

啟用 API

您必須先啟用 Model Armor API，才能使用 Model Armor。

控制台

啟用 Model Armor API。
啟用 API 時所需的角色
如要啟用 API，您需要服務使用情形管理員 IAM 角色 (roles/serviceusage.serviceUsageAdmin)，其中包含 serviceusage.services.enable 權限。瞭解如何授予角色。
啟用 API
選取要啟用 Model Armor 的專案。

gcloud

開始前，請使用 Google Cloud CLI 搭配 Model Armor API 執行下列步驟：

在 Google Cloud 控制台中啟用 Cloud Shell。

啟用 Cloud Shell

Google Cloud 主控台底部會開啟一個 Cloud Shell 工作階段，並顯示指令列提示。Cloud Shell 是已安裝 Google Cloud CLI 的殼層環境，並已針對您目前的專案設定好相關值。工作階段可能要幾秒鐘的時間才能初始化。
使用 gcloud CLI 設定 API 端點覆寫。

使用 gcloud CLI 設定 API 端點覆寫

如果您使用 gcloud CLI 啟用 Model Armor API，才需要執行這個步驟。您必須手動設定 API 端點覆寫，確保 gcloud CLI 正確將要求轉送至 Model Armor 服務。

執行下列指令，為 Model Armor 服務設定 API 端點。

gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"

將 LOCATION 替換為要使用 Model Armor 的區域。

管理配額

Model Armor 採用配額制度，確保公平使用並維護系統穩定性。Model Armor API 的預設配額為每個專案每分鐘 1,200 次查詢。您可以為每個專案套用介於 0 到 1,200 QPM 的值。如要申請調整配額，請參閱「要求調整配額」。如果預設配額不敷使用，請與 Cloud Customer Care 聯絡。

整合其他服務時，請務必考量 Model Armor 配額。您主要會與每項專案每分鐘的 API 要求數配額互動。

Model Armor 預設配額：當服務呼叫 Model Armor API 進行分析 (例如檢查提示或回覆) 時，會耗用專案的 Model Armor API 配額。
整合服務配額：Model Armor 配額與整合服務相關聯的任何配額不同。請確認要求路徑中的所有服務都有足夠配額。對 Model Armor API 進行的任何呼叫，都會計入Model Armor API 配額限制。

瞭解超出配額的情況

如果應用程式記錄顯示 Model Armor 發生錯誤 (通常是 HTTP 429 RESOURCE_EXHAUSTED 錯誤，表示要求過多)，就表示您已達到 Model Armor 配額限制。

預估配額需求

如要判斷要申請多少 Model Armor 配額，請按照下列步驟操作：

預估服務每分鐘傳送至 Model Armor 的要求數量上限。
請考量使用者與服務互動時，Model Armor 的呼叫次數 (例如提示詞呼叫一次，回覆呼叫一次)。
考量並行使用者或工作階段數上限。
要求配額時，請預留合理的緩衝區 (例如高於預期尖峰用量 20% 至 30%)，以因應突如其來的用量暴增。
請先盡量準確估算，上線後密切監控用量，並視需要要求進一步調整。

舉例來說，如果您預期每分鐘會有 500 位使用者，且每次使用者互動都會呼叫 Model Armor 兩次 (提示和回覆)，則至少需要 1,000 QPM。考量緩衝區後，建議先要求每分鐘 1,200 到 1,300 次查詢。

注意事項

請務必監控及管理其他服務的配額。即使您有足夠的 Model Armor 配額，其他服務的配額用盡仍會影響應用程式。
在應用程式設定中，導入具指數輪詢機制的用戶端重試功能，以處理暫時的配額問題或其他可重試的錯誤。詳情請參閱「重試策略」。

使用 REST API 整合

使用 REST API 進行整合時，Model Armor 只能做為偵測器，並使用範本。這項功能會根據預先定義的範本，找出並回報潛在的政策違規事項，但不會主動防範違規行為。整合 Model Armor API 後，應用程式就能根據 Model Armor 提供的安全性評估結果，封鎖或允許特定動作。Model Armor API 會傳回與 API 流量相關的潛在威脅或政策違規資訊，特別是 AI 互動。應用程式可以呼叫 Model Armor API，並根據回應中收到的資訊，按照預先定義的自訂邏輯做出決策並採取行動。

整合 Model Armor 時的選項

Model Armor 提供下列整合選項。每種選項提供的功能和能力都不相同。

整合選項	設定偵測作業	僅限檢查	檢查並封鎖	涵蓋範圍
代理程式閘道 (預先發布版)	僅使用範本	是	是	所有模型和所有雲端
Apigee	僅使用範本	是	是	所有模型和雲端²
Gemini Enterprise	僅使用範本	是	是	所有模型和雲端²
Google 和 Google Cloud MCP 伺服器	只使用底限設定	是	是	Google 和 Google Cloud MCP 伺服器
Service Extensions	僅使用範本	是	是	所有雲端平台上的 OpenAI 格式模型¹、代理程式和 MCP 伺服器²
Gemini Enterprise Agent Platform	使用底限設定和範本	是	是	Gemini 模型 (非串流)

¹許多熱門模型 (包括 Anthropic Claude、Mistral AI 和 Grok) 都支援 OpenAI 規格。這些模型通常會使用 vLLM 等推論引擎部署，這類引擎提供必要的 OpenAI 相容 API 層。vLLM 支援各種模型，包括 Meta Llama 系列、DeepSeek、Mistral 和 Mixtral 系列，以及 Gemma。

²包括 AWS 和 Azure 等其他公有雲。

透過 Gemini Enterprise Agent Platform 整合選項，Model Armor 可使用底限設定或範本，提供內嵌強制執行功能。也就是說，Model Armor 會直接介入程序，主動強制執行政策，不需修改應用程式程式碼。

Service Extensions 和 Gemini Enterprise 整合功能只會使用範本，強制執行內嵌政策。也就是說，Model Armor 可以直接強制執行政策，您不必在 Service Extensions 中，以及在 Gemini Enterprise 執行個體內與使用者或代理程式互動時，修改應用程式程式碼。

整合 Model Armor 和 Gemini Enterprise 後，系統只會清理初始使用者提示和最終的代理程式/模型回覆。從使用者最初的提示到最終生成的回應之間，任何中間步驟都不屬於這項整合功能涵蓋的範圍。

Security Command Center 中的 Model Armor

Model Armor 會檢查 LLM 提示詞和回覆，找出各種威脅，包括提示詞注入、越獄活動、惡意網址和有害內容。如果 Model Armor 偵測到違反已設定底限的行為，就會封鎖提示或回覆，並將發現項目傳送至 Security Command Center。詳情請參閱「Model Armor 發現項目」。