Criar um detector de rótulos de metadados personalizados

É possível configurar a Proteção de Dados Sensíveis para detectar rótulos de metadados específicos no seu conteúdo. Os metadados podem ser extraídos automaticamente de tipos de arquivo compatíveis ou fornecidos pelo aplicativo na solicitação de inspeção. Se a Proteção de dados sensíveis encontrar conteúdo que corresponda aos seus critérios de metadados, ela vai gerar uma descoberta.

Para verificar rótulos de metadados, crie um infoType de rótulo de metadados personalizado. Em seguida, configure sua inspeção ou verificação de descoberta para pesquisar esse infoType.

Benefícios e casos de uso

Com esse recurso, você pode usar as taxonomias de classificação atuais para inspeção e aplicação de políticas. Se você usa um sistema de classificação personalizado ou de terceiros que aplica rótulos de metadados aos seus documentos, é possível configurar a Proteção de Dados Sensíveis para detectar esses rótulos durante as operações de inspeção ou descoberta.

Exemplos de casos de uso:

  • Verificar arquivos em busca de rótulos de sensibilidade da Microsoft que contêm pares de chave-valor específicos.
  • Combine a detecção de rótulos de metadados com a detecção padrão de infoType para uma abordagem de várias camadas.
  • Verifique os metadados transmitidos com o conteúdo pelo aplicativo, mesmo que eles não estejam incorporados ao arquivo.
  • Limpe documentos usando o Model Armor com base em rótulos de metadados específicos. Para usar esse recurso com o Model Armor ou serviços que usam o Model Armor, como o Gemini Enterprise, crie uma configuração avançada da Proteção de Dados Sensíveis no Model Armor que faça referência a esse detector de rótulo de metadados personalizado.

Tipos de arquivos compatíveis

  • DOCX
  • PDF
  • PPTX
  • XLSX

Formatos de metadados compatíveis

Esse recurso pode detectar metadados de proteção de informações do Microsoft Purview e metadados fornecidos pelo cliente.

Metadados do Microsoft Purview Information Protection

Esse recurso pode detectar metadados do Microsoft Purview Information Protection que têm o seguinte formato de nome:

MSIP_Label_GUID_ATTRIBUTE

Substitua:

  • GUID: o identificador globalmente exclusivo dos metadados.
  • ATTRIBUTE: o atributo de proteção de informações da Microsoft dos metadados. Valores aceitos:

    • ActionId
    • ContentBits
    • Enabled
    • Method
    • Name
    • SetDate
    • SiteId

Metadados fornecidos pelo cliente

É possível fornecer metadados personalizados diretamente em uma solicitação InspectContent. Os metadados fornecidos pelo cliente são uma lista de pares de chave-valor transmitidos no campo ContentMetadata do ContentItem.

Limitações

Os infoTypes personalizados do tipo MetadataKeyValueExpression não são aceitos nos seguintes casos:

Criar um detector de infoType personalizado de rótulo de metadados

Para criar um detector de infoType personalizado de rótulo de metadados, defina um CustomInfoType do tipo MetadataKeyValueExpression em um objeto InspectConfig. O objeto CustomInfoType tem as seguintes propriedades:

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_METADATA_LABEL_NAME"
        },
        "likelihood": "LIKELIHOOD",
        "sensitivityScore":{
          "score": "SENSITIVITY_SCORE"
        },
        "metadata_key_value_expression": {
          "key_regex": "KEY_REGULAR_EXPRESSION",
          "value_regex": "VALUE_REGULAR_EXPRESSION"
        }
      }
    ]
  }
}

Substitua:

  • CUSTOM_METADATA_LABEL_NAME: o nome a ser atribuído ao detector de infoType personalizado.
  • LIKELIHOOD: (opcional) o valor Likelihood a ser atribuído a todas as descobertas que correspondem a esse infoType personalizado. Se você omitir esse campo, o nível de probabilidade padrão será VERY_LIKELY.
  • SENSITIVITY_SCORE: (opcional) o SensitivityScore a ser atribuído a todas as descobertas que correspondem a esse infoType personalizado. Se você omitir esse campo, a pontuação de sensibilidade padrão será HIGH.

    As pontuações de sensibilidade são usadas em perfis de dados. Ao criar perfis dos seus dados, a Proteção de Dados Sensíveis usa as pontuações de sensibilidade dos infoTypes para calcular o nível de sensibilidade.

  • KEY_REGULAR_EXPRESSION: uma expressão regular para pesquisar nas chaves dos rótulos de metadados.

  • VALUE_REGULAR_EXPRESSION: uma expressão regular para pesquisar nos valores dos rótulos de metadados.

Exemplo de detector para um rótulo de sensibilidade da Microsoft

Este exemplo de inspect_config define um infoType personalizado chamado CUSTOM_MIP_HIGHLY_CONFIDENTIAL. Esse infoType personalizado detecta um rótulo de proteção de informações do Microsoft Purview que contém o GUID 12345678-9012-3456-7890-123456789012 e está ativado:

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_MIP_HIGHLY_CONFIDENTIAL"
        },
        "likelihood": "VERY_LIKELY",
        "metadata_key_value_expression": {
          "key_regex": "MSIP_Label_12345678-9012-3456-7890-123456789012_Enabled",
          "value_regex": "true"
        }
      }
    ],
    "min_likelihood": "POSSIBLE"
  }
}

Quando você usa essa configuração em um job de inspeção, a Proteção de Dados Sensíveis gera uma descoberta CUSTOM_MIP_HIGHLY_CONFIDENTIAL se encontrar conteúdo em que a chave de metadados MSIP_Label_12345678-9012-3456-7890-123456789012_Enabled tenha o valor true.

Verificar metadados fornecidos pelo cliente

Para verificar rótulos de metadados fornecidos pelo cliente, siga estas etapas:

  1. Crie um detector de infoType de rótulo de metadados personalizado.
  2. Inclua os metadados que você quer verificar no campo ContentMetadata do seu ContentItem.

Exemplo de solicitação para verificação de metadados fornecidos pelo cliente

O exemplo a seguir mostra uma solicitação InspectContent que inclui um arquivo PDF e metadados fornecidos pelo cliente. A solicitação usa um infoType personalizado chamado CUSTOM_MIP_CONFIDENTIAL_INTERNAL_USE para verificar o arquivo e os metadados fornecidos em busca de arquivos marcados como "Confidencial" ou "Uso interno".

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_MIP_CONFIDENTIAL_INTERNAL_USE"
        },
        "likelihood": "VERY_LIKELY",
        "metadata_key_value_expression": {
          "key_regex": "MSIP_Label_.*_Name",
          "value_regex": "Confidential|Internal Use"
        }
      }
    ]
  },
  "item": {
    "byte_item": {
      "type": "PDF",
      "data": "BASE64_ENCODED_PDF"
    },
    "content_metadata": {
      "properties": [
        {
          "key": "MSIP_Label_174b6716-c2ea-4041-b631-5633733fbe46_Name",
          "value": "Confidential"
        }
      ]
    }
  }
}

Substitua BASE64_ENCODED_PDF por um arquivo codificado em base64 para verificação.

Se a Proteção de Dados Sensíveis encontrar uma correspondência nos metadados fornecidos pelo cliente, o MetadataType da descoberta para MetadataLocation será CLIENT_PROVIDED_METADATA. Se a correspondência estiver nos metadados extraídos do arquivo, como um rótulo MSIP, o valor será CONTENT_METADATA.

O MetadataType para MetadataLocation é preenchido com base em se a correspondência está em metadados extraídos de arquivos ou fornecidos pelo cliente.

A seguir