Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

개요

Model Armor는 Google Cloud 서비스와 통합되어 AI 및 대규모 언어 모델 (LLM) 상호작용을 보호합니다. Model Armor는 잠재적인 정책 위반을 식별하고 보고하며 보안 평가를 기반으로 작업을 적극적으로 차단할 수 있습니다.

지원되는 모달리티

Model Armor가 다른 Google Cloud 서비스와 통합되면 Model Armor는 LLM, 에이전트,MCP 서버 간의 텍스트 기반 입력 및 출력만 검사하고 분석합니다. Google Cloud Gemini Enterprise 통합의 문서를 제외한 다른 모달리티는 검사되지 않습니다. 지원되는 문서 유형에 대한 자세한 내용은 문서 검사를 참조하세요.

지원되는 서비스

이 섹션에서는 Model Armor와 통합할 수 있는 Google Cloud 서비스를 설명합니다.

에이전트 게이트웨이

Model Armor를 에이전트 게이트웨이와 통합하여 게이트웨이에서 관리하는 모든 에이전트와 주고받는 트래픽에 보안 정책을 적용합니다. 이 통합을 사용하면 악성 또는 규정 미준수 콘텐츠를 인라인으로 검사하고 차단할 수 있습니다. 이 통합은 애플리케이션 코드를 수정하지 않고도 워크플로 보안 및 조직 안전 가이드라인 준수를 개선하는 것을 목표로 합니다. 이 보호는 인그레스 (에이전트) 및 이그레스 (에이전트) 경로 모두에서 지원되는 프로토콜에 적용됩니다. 자세한 내용은 에이전트 게이트웨이와 통합을 참조하세요.

Apigee

이 통합을 사용하면 Apigee API 게이트웨이 레이어 내에서 직접 Model Armor의 AI 보호 기능을 사용할 수 있습니다. Apigee API 프록시 내에서 특정 Model Armor 정책을 구성합니다. API 호출이 이러한 정책이 있는 Apigee 프록시를 통과하면 Apigee는 검사를 위해 프롬프트와 응답을 Model Armor 서비스로 보냅니다. 자세한 내용은, Apigee와 통합을 참조하세요.

Gemini Enterprise

Model Armor는 Gemini Enterprise 를 사용하여 템플릿과 직접 통합할 수 있습니다. Gemini Enterprise는 Model Armor를 통해 사용자와 에이전트, 기본 LLM 간의 상호작용을 라우팅합니다. 즉, 사용자 또는 상담사의 프롬프트와 LLM에서 생성된 대답은 사용자에게 표시되기 전에 Model Armor에서 검사됩니다. 자세한 내용은 Gemini Enterprise와 통합을 참조하세요.

지원되는 모달리티에 나열된 모달리티 외에도 Gemini Enterprise와 Model Armor의 통합 은 문서도 지원합니다. 하지만 문서에 삽입된 이미지는 검사되지 않습니다.

Google 및 Google Cloud MCP 서버

Model Armor는 데이터를 보호하고 모델 컨텍스트 프로토콜 (MCP) 도구 및 서버를 노출하는 Google Cloud 서비스에 요청을 보낼 때 콘텐츠를 보호하도록 구성할 수 있습니다. Model Armor는 최소 기준 설정을 사용하여 MCP 도구 호출 및 응답을 정리하여 에이전트 AI 애플리케이션을 보호하는 데 도움이 됩니다. 이 프로세스는 프롬프트 인젝션 및 민감한 데이터 공개와 같은 위험을 완화합니다. 자세한 내용은 Google 및 MCP 서버와 통합을 참조하세요. Google Cloud

Service Extensions

Model Armor는 Google Cloud 네트워킹 서비스 를 통해 Service Extensions와 통합할 수 있습니다. Service Extensions를 사용하면 트래픽을 처리하기 위해 내부 (Google Cloud 서비스) 또는 외부 (사용자 관리형) 서비스를 통합할 수 있습니다. 애플리케이션 부하 분산기에서 서비스 확장 프로그램을 구성하여 에이전트 및 MCP 서버와 같은 다양한 AI 상호작용에 대한 네트워크 트래픽을 검사할 수 있습니다. GKE 추론 게이트웨이와 함께 Service Extensions를 사용하여 GKE 클러스터와 주고받는 트래픽을 검사할 수도 있습니다. 이렇게 하면 부하 분산기를 통과하는 모든 AI 상호작용이 Model Armor로 보호됩니다. 자세한 내용은 네트워킹 서비스와 통합 Google Cloud 을 참조하세요.

Gemini Enterprise 에이전트 플랫폼

Model Armor는 최소 기준 설정 또는 템플릿을 사용하여 Gemini Enterprise 에이전트 플랫폼에 직접 통합할 수 있습니다. 이 통합은 Gemini 모델 요청과 응답을 검사하고 최소 기준 설정을 위반하는 요청과 응답을 차단합니다. 이 통합은 Vertex AI의 Gemini API 내에서 generateContent 메서드에 대해 프롬프트 및 응답 보호를 제공합니다. 프롬프트 및 대답의 정리 결과를 확인하려면 Cloud Logging을 사용 설정해야 합니다. 자세한 내용은 Gemini Enterprise 에이전트 플랫폼과 통합을 참조하세요.

시작하기 전에

API 사용 설정

Model Armor를 사용하려면 먼저 Model Armor API를 사용 설정해야 합니다.

콘솔

Model Armor API를 사용 설정합니다.
API 사용 설정에 필요한 역할
API를 사용 설정하려면 serviceusage.services.enable 권한이 포함된 서비스 사용량 관리자 IAM 역할(roles/serviceusage.serviceUsageAdmin)이 필요합니다. 역할 부여 방법 알아보기
API 사용 설정하기
Model Armor를 활성화할 프로젝트를 선택합니다.

gcloud

시작하기 전에 Model Armor API와 함께 Google Cloud CLI를 사용하여 다음 단계를 따르세요.

콘솔에서 Cloud Shell을 활성화합니다. Google Cloud

Cloud Shell 활성화

콘솔 하단에 Cloud Shell 세션이 시작되고 명령줄 프롬프트가 표시됩니다. Google Cloud Cloud Shell은 Google Cloud CLI가 사전 설치된 셸 환경으로, 현재 프로젝트의 값이 이미 설정되어 있습니다. 세션이 초기화되는 데 몇 초 정도 걸릴 수 있습니다.
gcloud CLI를 사용하여 API 엔드포인트 재정의를 설정합니다.

gcloud CLI를 사용하여 API 엔드포인트 재정의 설정

이 단계는 gcloud CLI를 사용하여 Model Armor API를 사용 설정하는 경우에만 필요합니다. gcloud CLI가 요청을 Model Armor 서비스로 올바르게 라우팅하도록 하려면 API 엔드포인트 재정의를 수동으로 설정해야 합니다.

다음 명령어를 실행하여 Model Armor 서비스의 API 엔드포인트를 설정합니다.

gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"

LOCATION을 Model Armor를 사용하려는 리전으로 바꿉니다.

할당량 관리

Model Armor는 할당량 시스템 을 사용하여 공정한 사용을 보장하고 시스템 안정성을 보호합니다. Model Armor API의 기본 할당량은 프로젝트당 1,200 QPM입니다. 프로젝트당 0~1,200 QPM의 값을 적용할 수 있습니다. 조정을 요청하려면 할당량 조정 요청을 참조하세요. 기본 할당량보다 더 많은 할당량이 필요한 경우 Cloud Customer Care에 문의하세요.

Model Armor 할당량은 다른 서비스와 통합할 때 중요한 고려사항이 필요합니다. 상호작용하는 기본 할당량은 프로젝트당 분당 API 요청 수입니다.

Model Armor 기본 할당량: 서비스가 분석을 위해 Model Armor API를 호출하면 (예: 프롬프트 또는 응답 확인) 프로젝트의 Model Armor API 할당량이 사용됩니다.
통합 서비스 할당량: Model Armor 할당량은 통합 서비스와 연결된 할당량과 별개입니다. 요청 경로의 모든 서비스에 충분한 할당량이 있는지 확인해야 합니다. 애플리케이션의 콘텐츠를 정리하기 위해 Model Armor API에 대한 모든 호출은 Model Armor API 할당량 한도에 포함됩니다.

할당량 초과 상황 알아보기

애플리케이션 로그에 Model Armor의 오류(일반적으로 HTTP 429 RESOURCE_EXHAUSTED 오류)가 표시되면 Model Armor 할당량 한도에 도달한 것입니다. 이는 요청이 너무 많음을 나타냅니다.

할당량 요구사항 예측

요청할 Model Armor 할당량을 확인하려면 다음 단계를 따르세요.

서비스가 Model Armor로 보낼 분당 최대 요청 수를 예측합니다.
서비스와의 사용자 상호작용당 Model Armor가 호출되는 횟수를 고려합니다 (예: 프롬프트에 한 번, 응답에 한 번).
최대 동시 사용자 또는 세션 수를 고려합니다.
예상되는 최대치보다 20~30% 높은 적절한 버퍼가 있는 할당량을 요청하여 예기치 않은 급증을 처리합니다.
최대한 정확하게 예측하여 시작하고 출시 후 사용량을 면밀히 모니터링하며 필요에 따라 추가 조정을 요청합니다.

예를 들어 분당 500명의 사용자가 예상되고 각 사용자 상호작용에서 Model Armor를 두 번 호출하는 경우 (프롬프트 및 응답) 최소 1,000 QPM이 필요합니다. 버퍼를 고려하여 1,200~1,300 QPM을 요청하는 것이 좋은 시작점입니다.

고려사항

다른 서비스의 할당량을 모니터링하고 관리해야 합니다. Model Armor 할당량이 충분하더라도 다른 서비스의 할당량이 부족하면 애플리케이션에 영향을 미칩니다.
일시적인 할당량 문제 또는 재시도 가능한 기타 오류를 처리하기 위해 애플리케이션 설정에서 지수 백오프를 사용하여 클라이언트 측 재시도를 구현합니다. 자세한 내용은 재시도 전략을 참조하세요.

REST API를 사용하여 통합

통합에 REST API를 사용하면 Model Armor는 템플릿을 사용하는 감지기로만 작동합니다. 잠재적인 정책 위반을 적극적으로 방지하기보다는 사전 정의된 템플릿을 기반으로 식별하고 보고합니다. Model Armor API와 통합할 때 애플리케이션은 Model Armor의 출력을 사용하여 제공된 보안 평가 결과를 기반으로 작업을 차단하거나 허용할 수 있습니다. Model Armor API는 특히 AI 상호작용의 경우 API 트래픽과 관련된 잠재적 위협이나 정책 위반에 대한 정보를 반환합니다. 애플리케이션은 Model Armor API를 호출하고 응답에서 수신한 정보를 사용하여 사전 정의된 커스텀 로직에 따라 결정을 내리고 조치를 취할 수 있습니다.

Model Armor 통합 시 옵션

Model Armor는 다음과 같은 통합 옵션을 제공합니다. 각 옵션은 서로 다른 특징과 기능을 제공합니다.

통합 옵션	감지 구성	검사 전용	검사 및 차단	적용 범위
에이전트 게이트웨이 (미리보기)	템플릿만 사용	예	예	모든 모델 및 모든 클라우드
Apigee	템플릿만 사용	예	예	모든 모델 및 모든 클라우드²
Gemini Enterprise	템플릿만 사용	예	예	모든 모델 및 모든 클라우드²
Google 및 Google Cloud MCP 서버	최소 기준 설정만 사용	예	예	Google 및 Google Cloud MCP 서버
Service Extensions	템플릿만 사용	예	예	모든 클라우드²의 OpenAI 형식 모델¹, 에이전트, MCP 서버
Gemini Enterprise 에이전트 플랫폼	최소 기준 설정및 템플릿모두 사용	예	예	Gemini 모델 (스트리밍 아님)

¹Anthropic Claude, Mistral AI, Grok을 비롯한 여러 인기 모델이 OpenAI 사양을 지원합니다. 이러한 모델은 일반적으로 필요한 OpenAI 호환 API 레이어를 제공하는 vLLM과 같은 추론 엔진을 사용하여 배포됩니다. vLLM은 Meta Llama 시리즈, DeepSeek, Mistral 및 Mixtral 제품군, Gemma를 비롯한 광범위한 모델을 지원합니다.

²AWS 및 Azure와 같은 다른 공개 클라우드를 포함합니다.

Gemini Enterprise 에이전트 플랫폼 통합 옵션을 사용하면 Model Armor가 최소 기준 설정 또는 템플릿을 사용하여 인라인 적용을 제공합니다. 즉, Model Armor는 애플리케이션 코드를 수정하지 않고도 프로세스에 직접 개입하여 정책을 적극적으로 적용합니다.

Service Extensions 및 Gemini Enterprise 통합은 인라인 정책 적용에 템플릿만 사용합니다. 즉, Model Armor는 Service Extensions 내에서와 Gemini Enterprise 인스턴스 내의 사용자 또는 에이전트 상호작용 중에 애플리케이션 코드를 수정하지 않고도 정책을 직접 적용할 수 있습니다.

Model Armor 및 Gemini Enterprise 통합은 초기 사용자 프롬프트와 최종 에이전트 또는 모델 응답만 정리합니다. 초기 사용자 프롬프트와 최종 대답 생성 사이에 발생하는 중간 단계는 이 통합에 포함되지 않습니다.

Security Command Center의 Model Armor

Model Armor는 프롬프트 인젝션, 탈옥 시도, 악성 URL, 유해한 콘텐츠를 비롯한 다양한 위협에 대해 LLM 프롬프트와 응답을 검사합니다. Model Armor가 구성된 최소 기준 설정 위반을 감지하면 프롬프트 또는 응답을 차단하고 Security Command Center에 발견 사항을 보냅니다. 자세한 내용은 Model Armor 발견 항목을 참조하세요.