콘텐츠 보안 모니터링

이 문서에서는 지원되는 AI 에이전트에 대해 Model Armor에서 콘텐츠 보안 통계를 보는 방법을 설명합니다지원되는 AI 에이전트.

Model Armor는 간접 프롬프트 인젝션 공격, 민감한 정보 유출, 유해한 콘텐츠 생성 또는 제공과 같은 보안 위험에 대해 요청과 응답을 검사합니다. 자세한 내용은 Model Armor를 참조하세요.

다음 수준에서 Model Armor 작업 결과를 볼 수 있습니다.

시작하기 전에

  1. 계정에 로그인합니다. Google Cloud 를 처음 사용하는 경우 Google Cloud, 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Enable the Model Armor API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  3. Enable the Model Armor API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  4. 프로젝트에서 하나 이상의 게이트웨이에 Model Armor를 구성합니다.
  5. a Google Cloud MCP 서버와 통신하는 에이전트를 모니터링하려면 MCP 서버로 Model Armor를 구성합니다.
  6. 에이전트에 추적을 설정합니다.

필요한 역할

콘텐츠 보안 위반을 모니터링하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요.

역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

이러한 사전 정의된 역할에는 콘텐츠 보안 위반을 모니터링하는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.

필수 권한

콘텐츠 보안 위반을 모니터링하려면 다음 권한이 필요합니다.

  • monitoring.monitoredResourceDescriptors.list
  • monitoring.metricDescriptors.list

커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.

고객 지원 담당자

보안 탭은 다음 에이전트에 대한 Model Armor 통계로만 채워집니다.

프로젝트에서 지원되는 AI 에이전트의 콘텐츠 통계 보기 (최상위 뷰)

프로젝트에서 지원되는 모든 AI 에이전트의 콘텐츠 보안 통계를 보려면 다음 단계를 따르세요.

  1. 콘솔에서 Gemini Enterprise 에이전트 플랫폼 보안 탭으로 이동합니다. Google Cloud

    보안으로 이동

  2. 프로젝트를 선택합니다.

보안 탭에 콘텐츠 보안 통계가 표시되지 않고 프로젝트에 지원되는 AI 에이전트가 있는 경우 에이전트에 추적을 설정했는지 확인하세요.

AI 에이전트의 콘텐츠 통계 보기 (에이전트 수준 뷰)

지원되는 에이전트의 콘텐츠 보안 통계를 보려면 다음 단계를 따르세요.

  1. 콘솔에서 에이전트 레지스트리로 이동합니다. Google Cloud

    에이전트 레지스트리로 이동

  2. 프로젝트를 선택합니다.
  3. 에이전트 이름을 클릭합니다.
  4. 보안 탭을 클릭합니다.

플래그가 지정되거나 차단된 상호작용 수 보기

최상위 또는 에이전트 수준 보안 탭으로 이동합니다.

보안 탭에서 플래그가 지정된 상호작용과 차단된 상호작용을 비롯한 상호작용 수를 확인합니다. 보안 탭에는 다음 측정항목이 표시됩니다.

  • 총 상호작용: Model Armor에서 분석한 프롬프트와 대답의 총개수입니다.
  • 플래그가 지정된 상호작용: Model Armor 템플릿 또는 최소 기준 설정에서 구성된 정책을 위반한 상호작용 수입니다.
  • 차단된 상호작용: INSPECT_AND_BLOCK 모드에서 Model Armor를 구성한 경우 차단된 상호작용 수입니다. 이러한 차단된 상호작용은 최소 기준 설정 또는 템플릿을 위반했습니다.

콘텐츠 보안 위반 모니터링

최상위 또는 에이전트 수준 보안 탭으로 이동합니다.

시간 경과에 따른 위반 차트에서 시간 경과에 따라 감지된 위반 수를 모니터링합니다.

감지된 위반은 다음 영역으로 분류됩니다.

  • 프롬프트 인젝션 및 탈옥: 악성 명령어 또는 탈옥 시도가 포함된 프롬프트가 있음을 나타내는 콘텐츠 위반입니다. 자세한 내용은 프롬프트 인젝션 및 탈옥 감지를 참조하세요.
  • 악성 URL: 악성 URL이 있음을 나타내는 콘텐츠 위반입니다. 자세한 내용은 악성 URL 탐지를 참조하세요.
  • 책임감 있는 AI: 괴롭힘 및 증오심 표현과 같은 안전 필터에서 감지되는 콘텐츠 위반입니다. 책임감 있는 AI 카테고리의 전체 목록은 책임감 있는 AI 안전 필터를 참조하세요.
  • 민감한 정보: 민감한 정보 유형 또는 사용자가 정의하는커스텀 정보 유형이 있는 콘텐츠 위반입니다. 자세한 내용은 Sensitive Data Protection을 참조하세요.

이러한 감지기에 대한 자세한 내용은 Model Armor 필터를 참조하세요.

위반이 가장 많은 에이전트 식별

최상위 보안 탭으로 이동합니다.

보안 탭에는 위반이 가장 많은 상위 10개 에이전트가 표시됩니다. 목록에는 각 에이전트의 에이전트 ID와 해당 에이전트에 대해 감지된 위반 수가 표시됩니다.

목록에서 특정 에이전트의 Model Armor 인사이트를 보려면 에이전트 레지스트리로 이동하여 에이전트 ID로 에이전트를 검색합니다. 그런 다음 해당 에이전트의 에이전트 수준 보안 탭으로 이동합니다.

에이전트 레지스트리로 이동

SQL을 사용하여 원격 분석 데이터 쿼리 및 분석

Model Armor의 원격 분석 데이터를 쿼리하고 분석하려면 SQL 기반 쿼리 인터페이스를 제공하는 모니터링 가능성 분석을 사용하세요.

  1. 최상위 보안 탭으로 이동합니다.
  2. 쿼리할 뷰에서 차트 옵션 더보기 > 모니터링 가능성 분석에서 탐색을 클릭합니다.

모니터링 가능성 분석 사용 방법에 대한 일반적인 안내는 모니터링 가능성 분석으로 원격 분석 쿼리 및 분석을 참조하세요.

위반 데이터를 PNG 또는 CSV 파일로 다운로드

위반 데이터를 PNG 또는 CSV 파일로 다운로드하려면 다음 단계를 따르세요.

  1. 보안 탭의 시간 경과에 따른 위반 뷰에서 데이터를 다운로드할 기간을 선택합니다.
  2. 차트 옵션 더보기 > 다운로드를 클릭합니다.
  3. PNG 다운로드 또는 CSV 다운로드 를 클릭하여 원하는 형식으로 데이터를 다운로드합니다.

다음 단계

가이드

Model Armor의 감사 로깅에 대해 알아봅니다.

가이드

Model Armor의 로깅을 구성하는 방법을 알아봅니다.

문제 해결

Model Armor 문제를 해결하는 방법을 알아봅니다.