Empregos e acionadores de empregos

Uma tarefa é uma ação que a proteção de dados confidenciais executa para analisar conteúdo em busca de dados confidenciais ou calcular o risco de reidentificação. A proteção de dados confidenciais cria e executa um recurso de tarefa sempre que lhe indica para inspecionar os seus dados.

Atualmente, existem dois tipos de tarefas de proteção de dados confidenciais:

  • Os trabalhos de inspeção inspecionam o seu conteúdo para verificar a existência de dados confidenciais de acordo com os seus critérios e geram relatórios de resumo sobre a localização e o tipo de dados confidenciais existentes.
  • Os trabalhos de análise de risco analisam dados desidentificados e devolvem métricas sobre a probabilidade de os dados poderem ser reidentificados.

Pode agendar a execução de tarefas da Proteção de dados confidenciais criando acionadores de tarefas. Um acionador de tarefas é um evento que automatiza a criação de tarefas de proteção de dados confidenciais para analisar Google Cloud repositórios de armazenamento, Google Cloud incluindo contentores do Cloud Storage, tabelas do BigQuery e tipos do Datastore.

Os acionadores de tarefas permitem-lhe agendar tarefas de análise definindo intervalos em que cada acionador é acionado. Podem ser configurados para procurar novas conclusões desde a última execução da análise para ajudar a monitorizar alterações ou adições ao conteúdo, ou para gerar relatórios de conclusões atualizados. Os acionadores agendados são executados num intervalo que define, de 1 a 60 dias.

Passos seguintes

Mais informações sobre como criar, editar e executar tarefas e acionadores de tarefas nos seguintes tópicos:

Além disso, está disponível o seguinte início rápido:

O objeto JobTrigger

Um acionador de tarefa é representado na API DLP pelo objeto JobTrigger.

Campos de configuração do acionador de tarefas

Cada JobTrigger contém vários campos de configuração, incluindo:

  • O nome e o nome a apresentar do acionador, bem como uma descrição.
  • Uma coleção de Trigger objetos, cada um dos quais contém um objeto Schedule, que define a recorrência da análise em segundos.
  • Um objeto InspectJobConfig que contém as informações de configuração da tarefa acionada.
  • Uma Status enumeração que indica se o acionador está atualmente ativo.
  • Campos de data/hora que representam as horas de criação, atualização e última execução.
  • Uma coleção de objetos Error, se tiverem sido encontrados quando o acionador foi ativado.

Métodos de acionamento de tarefas

Cada objeto JobTrigger também inclui vários métodos incorporados. Ao usar estes métodos, pode:

Latência da tarefa

Não existem objetivos ao nível do serviço (SLO) garantidos para tarefas e acionadores de tarefas. A latência é afetada por vários fatores, incluindo a quantidade de dados a analisar, o repositório de armazenamento que está a ser analisado, o tipo e o número de infoTypes que está a procurar, a região onde a tarefa é processada e os recursos de computação disponíveis nessa região. Por conseguinte, não é possível determinar antecipadamente a latência das tarefas de inspeção.

Para ajudar a reduzir a latência das tarefas, pode experimentar o seguinte:

  • Se a amostragem estiver disponível para o seu trabalho ou acionador de trabalho, ative-a.
  • Evite ativar infoTypes de que não precisa. Embora as seguintes sejam úteis em determinados cenários, estes infoTypes podem fazer com que os pedidos sejam executados muito mais lentamente do que os pedidos que não os incluem:

    • PERSON_NAME
    • FEMALE_NAME
    • MALE_NAME
    • FIRST_NAME
    • LAST_NAME
    • DATE_OF_BIRTH
    • LOCATION
    • STREET_ADDRESS
    • ORGANIZATION_NAME
  • Especifique sempre os infoTypes explicitamente. Não use uma lista infoTypes vazia.

  • Se possível, use uma região de processamento diferente.

Se continuar a ter problemas de latência com tarefas depois de experimentar estas técnicas, considere usar pedidos content.inspect ou content.deidentify em vez de tarefas. Estes métodos são abrangidos pelo contrato de nível de serviço. Para mais informações, consulte o contrato de nível de serviço de proteção de dados confidenciais.

Limite as análises apenas a novo conteúdo

Pode configurar o acionador da tarefa para definir automaticamente a data do intervalo de tempo para os ficheiros armazenados no Cloud Storage ou no BigQuery. Quando define o objeto TimespanConfig para preenchimento automático, a proteção de dados confidenciais apenas analisa os dados que foram adicionados ou modificados desde a última execução do acionador:

...
  timespan_config {
        enable_auto_population_of_timespan_config: true
      }
...

Para a inspeção do BigQuery, apenas são incluídas na análise as linhas com, pelo menos, três horas. Consulte o problema conhecido relacionado com esta operação.

Acione tarefas no carregamento de ficheiros

Além do suporte para acionadores de tarefas, que está integrado na proteção de dados confidenciais, oGoogle Cloud também tem uma variedade de outros componentes que pode usar para integrar ou acionar tarefas de proteção de dados confidenciais. Por exemplo, pode usar funções do Cloud Run para acionar uma análise do Sensitive Data Protection sempre que um ficheiro é carregado para o Cloud Storage.

Para obter informações sobre como configurar esta operação, consulte o artigo Automatizar a classificação dos dados carregados para o Cloud Storage.