이 문서에서는 지원되는 AI 에이전트에 대해 Model Armor에서 콘텐츠 보안 통계를 보는 방법을 설명합니다지원되는 AI 에이전트.
Model Armor는 간접 프롬프트 인젝션 공격, 민감한 정보 유출, 유해한 콘텐츠 생성 또는 제공과 같은 보안 위험에 대해 요청과 응답을 검사합니다. 자세한 내용은 Model Armor를 참조하세요.
다음 수준에서 Model Armor 작업 결과를 볼 수 있습니다.
시작하기 전에
- 계정에 로그인합니다. Google Cloud 를 처음 사용하는 경우 Google Cloud, 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
Enable the Model Armor API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.Enable the Model Armor API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.- 프로젝트에서 하나 이상의 게이트웨이에 Model Armor를 구성합니다.
- a Google Cloud MCP 서버와 통신하는 에이전트를 모니터링하려면 MCP 서버로 Model Armor를 구성합니다.
- 에이전트에 추적을 설정합니다.
필요한 역할
콘텐츠 보안 위반을 모니터링하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요.
- 모니터링 가능성 뷰 접근자 (
roles/observability.viewAccessor) - 모니터링 가능성 분석 사용자 (
roles/observability.analyticsUser) - 로그 뷰어 (
roles/logging.viewer) - 로그 뷰 접근자 (
roles/logging.viewAccessor)
역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.
이러한 사전 정의된 역할에는 콘텐츠 보안 위반을 모니터링하는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.
필수 권한
콘텐츠 보안 위반을 모니터링하려면 다음 권한이 필요합니다.
-
monitoring.monitoredResourceDescriptors.list -
monitoring.metricDescriptors.list
커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.
고객 지원 담당자
보안 탭은 다음 에이전트에 대한 Model Armor 통계로만 채워집니다.
- Model Armor가 구성된 게이트웨이에서 관리되고 에이전트 런타임에 배포된 에이전트
- 에이전트 런타임에 배포되고 다음과 통신하는 Google Cloud MCP 서버 에이전트
- Model Armor 최소 기준 설정이 구성된 프로젝트의 에이전트 런타임에 배포된 에이전트
프로젝트에서 지원되는 AI 에이전트의 콘텐츠 통계 보기 (최상위 뷰)
프로젝트에서 지원되는 모든 AI 에이전트의 콘텐츠 보안 통계를 보려면 다음 단계를 따르세요.
- 콘솔에서 Gemini Enterprise 에이전트 플랫폼 보안 탭으로 이동합니다. Google Cloud
- 프로젝트를 선택합니다.
보안 탭에 콘텐츠 보안 통계가 표시되지 않고 프로젝트에 지원되는 AI 에이전트가 있는 경우 에이전트에 추적을 설정했는지 확인하세요.
AI 에이전트의 콘텐츠 통계 보기 (에이전트 수준 뷰)
지원되는 에이전트의 콘텐츠 보안 통계를 보려면 다음 단계를 따르세요.
- 콘솔에서 에이전트 레지스트리로 이동합니다. Google Cloud
- 프로젝트를 선택합니다.
- 에이전트 이름을 클릭합니다.
- 보안 탭을 클릭합니다.
플래그가 지정되거나 차단된 상호작용 수 보기
보안 탭에서 플래그가 지정된 상호작용과 차단된 상호작용을 비롯한 상호작용 수를 확인합니다. 보안 탭에는 다음 측정항목이 표시됩니다.
- 총 상호작용: Model Armor에서 분석한 프롬프트와 대답의 총개수입니다.
- 플래그가 지정된 상호작용: Model Armor 템플릿 또는 최소 기준 설정에서 구성된 정책을 위반한 상호작용 수입니다.
- 차단된 상호작용:
INSPECT_AND_BLOCK모드에서 Model Armor를 구성한 경우 차단된 상호작용 수입니다. 이러한 차단된 상호작용은 최소 기준 설정 또는 템플릿을 위반했습니다.
콘텐츠 보안 위반 모니터링
시간 경과에 따른 위반 차트에서 시간 경과에 따라 감지된 위반 수를 모니터링합니다.
감지된 위반은 다음 영역으로 분류됩니다.
- 프롬프트 인젝션 및 탈옥: 악성 명령어 또는 탈옥 시도가 포함된 프롬프트가 있음을 나타내는 콘텐츠 위반입니다. 자세한 내용은 프롬프트 인젝션 및 탈옥 감지를 참조하세요.
- 악성 URL: 악성 URL이 있음을 나타내는 콘텐츠 위반입니다. 자세한 내용은 악성 URL 탐지를 참조하세요.
- 책임감 있는 AI: 괴롭힘 및 증오심 표현과 같은 안전 필터에서 감지되는 콘텐츠 위반입니다. 책임감 있는 AI 카테고리의 전체 목록은 책임감 있는 AI 안전 필터를 참조하세요.
- 민감한 정보: 민감한 정보 유형 또는 사용자가 정의하는커스텀 정보 유형이 있는 콘텐츠 위반입니다. 자세한 내용은 Sensitive Data Protection을 참조하세요.
이러한 감지기에 대한 자세한 내용은 Model Armor 필터를 참조하세요.
위반이 가장 많은 에이전트 식별
최상위 보안 탭으로 이동합니다.
보안 탭에는 위반이 가장 많은 상위 10개 에이전트가 표시됩니다. 목록에는 각 에이전트의 에이전트 ID와 해당 에이전트에 대해 감지된 위반 수가 표시됩니다.
목록에서 특정 에이전트의 Model Armor 인사이트를 보려면 에이전트 레지스트리로 이동하여 에이전트 ID로 에이전트를 검색합니다. 그런 다음 해당 에이전트의 에이전트 수준 보안 탭으로 이동합니다.
SQL을 사용하여 원격 분석 데이터 쿼리 및 분석
Model Armor의 원격 분석 데이터를 쿼리하고 분석하려면 SQL 기반 쿼리 인터페이스를 제공하는 모니터링 가능성 분석을 사용하세요.
- 최상위 보안 탭으로 이동합니다.
- 쿼리할 뷰에서 차트 옵션 더보기 > 모니터링 가능성 분석에서 탐색을 클릭합니다.
모니터링 가능성 분석 사용 방법에 대한 일반적인 안내는 모니터링 가능성 분석으로 원격 분석 쿼리 및 분석을 참조하세요.
위반 데이터를 PNG 또는 CSV 파일로 다운로드
위반 데이터를 PNG 또는 CSV 파일로 다운로드하려면 다음 단계를 따르세요.
- 보안 탭의 시간 경과에 따른 위반 뷰에서 데이터를 다운로드할 기간을 선택합니다.
- 차트 옵션 더보기 > 다운로드를 클릭합니다.
- PNG 다운로드 또는 CSV 다운로드 를 클릭하여 원하는 형식으로 데이터를 다운로드합니다.