Referência de métricas

Esta página lista e descreve todas as métricas recolhidas nos perfis de dados.

Existem três tipos de perfis de dados: perfis de dados de projetos, perfis de dados de tabelas e perfis de dados de colunas.

Perfis de dados de projetos

Cada perfil de dados do projeto tem os seguintes campos. Os valores destes campos são agregados com base nos recursos analisados no projeto.

Estatísticas

Os perfis de dados do projeto fornecem as seguintes estatísticas:

Risco de dados
Nível de risco associado aos dados no seu estado atual. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
Sensibilidade
Pontuação que indica o nível de sensibilidade deste projeto. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.

Metadados

Os perfis de dados do projeto fornecem os seguintes metadados:

Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
ID do projeto
ID do projeto que foi analisado.
Nome do recurso
Nome totalmente qualificado do perfil de dados.
Estado
Ícone que indica o estado da operação de criação de perfis.

Perfis de dados de tabelas

Cada perfil de dados de tabela tem os seguintes campos:

Estatísticas

Os perfis de dados de tabelas fornecem as seguintes estatísticas:

Risco de dados
Nível de risco associado aos dados no seu estado atual. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
Sensibilidade
Pontuação que indica o nível de confidencialidade desta tabela. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.

Metadados

Os perfis de dados de tabelas fornecem os seguintes metadados:

Bases de dados
A base de dados que contém a tabela da qual foi criado um perfil. Este campo aplica-se apenas à deteção do Cloud SQL.
ID do conjunto de dados
ID do conjunto de dados que contém esta tabela.
Encriptação
Se a encriptação desta tabela é gerida pela Google ou pela sua organização.
Período de validade
Opcional. A hora em que esta tabela expira.
Contagem de colunas com falhas
O número de colunas ignoradas nesta tabela devido a um erro.
Inspeção do resumo da configuração
Imagem instantânea do modelo de inspeção que foi usado quando o perfil foi gerado. Para mais informações, consulte o artigo Instantâneos do perfil de dados.
Instância
A instância que contém a tabela da qual foi criado um perfil. Este campo aplica-se apenas à deteção do Cloud SQL.
Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
Última atualização no BigQuery
Data e hora em que esta tabela foi modificada pela última vez.
ID do projeto
ID do projeto que contém esta tabela.
Público

Se esta tabela está disponível para todos os utilizadores ou restrita a determinados utilizadores.

Etiquetas de recursos

Etiquetas que a tabela tinha no momento em que o perfil foi gerado.

Etiquetas de recursos

Etiquetas que a tabela tinha no momento em que o perfil foi gerado.

Nome do recurso

Nome totalmente qualificado do perfil de dados.

Número de linhas

Número de linhas nesta tabela quando o perfil foi gerado.

Contagem de colunas analisadas

O número de colunas analisadas nesta tabela.

Conta de serviço

Número de contas de serviço com autorizações da IAM para aceder a esta tabela.

Estado

Indicação de se o perfil foi gerado com êxito.

ID da tabela

ID desta tabela.

Hora de criação da tabela

Data e hora em que a tabela foi criada.

Tamanho da tabela

O tamanho desta tabela quando o perfil foi gerado.

Tipo

O tipo de descoberta realizada.

Perfis de dados de colunas

Cada perfil de dados de coluna tem os seguintes campos:

Estatísticas

Os perfis de dados das colunas fornecem as seguintes estatísticas:

Risco de dados
Nível de risco associado aos dados no seu estado atual. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
Sensibilidade
Pontuação que indica o nível de confidencialidade desta coluna. Para mais informações, consulte os níveis de sensibilidade e risco de dados.
infoType previsto

Se um único infoType incorporado ou personalizado predominar claramente sobre os outros na coluna, a proteção de dados confidenciais define este campo para esse infoType. Caso contrário, este campo não tem valor.

Para ver uma lista de todos os infoTypes detetados na coluna, consulte o campo Outros infoTypes.

A proteção de dados confidenciais procura apenas os infoTypes que especificou no modelo de inspeção. Assim, apenas esses infoTypes podem aparecer no campo infoType previsto. Por exemplo, se a coluna tiver endereços de email, mas não incluiu o detetor infoType EMAIL_ADDRESS no modelo de inspeção, este campo não contém EMAIL_ADDRESS.

Se os dados da coluna corresponderem predominantemente a vários infoTypes estreitamente relacionados que pertencem à mesma categoria geral, a Proteção de dados confidenciais define este campo para o infoType mais geral. Por exemplo, se a coluna tiver predominantemente uma combinação de infoTypes PASSPORT, AUSTRALIA_PASSPORT e CANADA_PASSPORT, o campo Predicted infoType é definido como PASSPORT. O campo Outros tipos de informações mostra os tipos de informações mais específicos e a respetiva prevalência estimada.

Outros infoTypes

InfoTypes detetados na coluna que não têm um sinal suficientemente forte para serem considerados o infoType previsto dessa coluna. Neste documento, consulte a secção Predicted infoType.

Para perfis de dados gerados após 13 de outubro de 2022, cada infoType apresentado neste campo tem uma prevalência estimada. A prevalência estimada é uma percentagem aproximada de linhas não nulas nas quais o infoType foi detetado.

Por exemplo, suponhamos que tem uma coluna com as seguintes métricas:

  • infoType previsto: FDA_CODE
  • Outros tipos de informações: PERSON_NAME (2%) e STREET_ADDRESS (1%)

Neste exemplo, existe uma forte indicação de que a coluna contém códigos da FDA. A proteção de dados confidenciais também determinou que aproximadamente 2% das linhas não nulas na coluna podem conter nomes de pessoas e 1% pode conter moradas.

A proteção de dados confidenciais procura apenas os infoTypes que especificou no modelo de inspeção. Assim, apenas esses infoTypes podem aparecer no campo Outros infoTypes. Por exemplo, se a coluna tiver endereços de email, mas não tiver incluído o detetor EMAIL_ADDRESS infoType no modelo de inspeção, este campo não contém EMAIL_ADDRESS.

Proporção nula estimada

Proporção aproximada de valores nulos nesta coluna, categorizada como alta, média, baixa ou muito baixa. Este valor é elevado se uma grande proporção de entradas nesta coluna for nula.

Unicidade estimada

Uma estimativa da quantidade de dados únicos nesta coluna, categorizada como alta, média ou baixa. Um nível de unicidade elevado sugere que a coluna contém valores distintos. Uma elevada presença de valores únicos pode indicar que a coluna contém identificadores.

Um nível de unicidade baixo sugere que a coluna contém muitos valores comuns, como enumerações ou valores booleanos.

Se a proteção de dados confidenciais determinar que não existem linhas suficientes na tabela para calcular esta métrica, este valor fica em branco.

Pontuação de texto livre

A probabilidade de esta coluna conter texto de forma livre. Um valor próximo de 1 indica que é provável que a coluna contenha texto de forma livre ou em linguagem natural. Os valores possíveis variam de 0 a 1.

Uma pontuação de texto livre elevada pode aumentar os níveis de risco e sensibilidade dos dados de uma coluna.

Metadados

Os perfis de dados das colunas fornecem os seguintes metadados:

Bases de dados
A base de dados que contém a coluna da tabela da qual foi criado um perfil. Este campo aplica-se apenas à descoberta do Cloud SQL.
Tipo de dados
O tipo de dados dos conteúdos desta coluna.
ID do conjunto de dados
ID do conjunto de dados que contém esta coluna da tabela.
ID do campo
Nome da coluna.
Instância
A instância que contém a coluna da tabela da qual foram criados perfis. Este campo aplica-se apenas à descoberta do Cloud SQL.
Localização da instância
Localização da instância que contém a coluna da tabela da qual foram criados perfis. Este campo aplica-se apenas à deteção do Cloud SQL.
Último perfil gerado
Data e hora em que o perfil foi gerado pela última vez.
Etiquetas de políticas
Indica se uma etiqueta de política é aplicada à coluna. Para informações sobre as práticas recomendadas para usar etiquetas de políticas, consulte o artigo Usar etiquetas de políticas no BigQuery.
ID do projeto
ID do projeto que contém esta coluna da tabela.
Nome do recurso
Nome totalmente qualificado do perfil de dados.
Estado
Ícone que indica o estado da operação de criação de perfis.
ID da tabela
ID da tabela que contém esta coluna.

Ficheiros de perfis de dados de lojas

A Proteção de dados confidenciais usa o termo armazenamento de ficheiros para se referir a um contentor ou um bucket de armazenamento de ficheiros.

Cada perfil de dados de armazenamento de ficheiros tem os seguintes campos.

Estatísticas

Os perfis de dados de lojas de ficheiros fornecem as seguintes estatísticas:

Risco de dados
Nível de risco associado aos dados no seu estado atual. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
Conjuntos de ficheiros
Fornece um resumo para cada cluster de ficheiros que foi detetado quando este arquivo de ficheiros foi analisado. Para mais informações sobre cada resumo, consulte a secção Resumos de clusters de ficheiros nesta página.
Sensibilidade
Pontuação que indica o nível de confidencialidade desta loja de ficheiros. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.

Metadados

Os perfis de dados de lojas de ficheiros fornecem os seguintes metadados:

Localizações de armazenamento de dados

Se tiver criado um perfil de um contentor do Cloud Storage de duas regiões, este campo apresenta as duas regiões.

Se tiver criado um perfil de um arquivo de ficheiros de outro fornecedor de nuvem, este valor é a região onde o fornecedor de nuvem armazena o arquivo de ficheiros.

Encriptação

Se a encriptação para este armazenamento de ficheiros é gerida pela Google ou pela sua organização.

Tipo de armazenamento de ficheiros

A origem dos dados analisados: Cloud Storage, Amazon S3 ou Azure Blob Storage.

Caminho da loja de ficheiros

O nome da loja de ficheiros.

Inspeção do resumo da configuração

Imagem instantânea do modelo de inspeção que foi usado quando o perfil foi gerado. Para mais informações, consulte o artigo Capturas instantâneas do perfil de dados.

Tipo de localização

Tipo de localização onde o arquivo de ficheiros está armazenado: region, dual-region ou multi-region.

Perfil criado pela primeira vez

Data e hora em que o perfil foi criado pela primeira vez.

Perfil gerado pela última vez

Data e hora da última geração do perfil.

ID superior

O recurso que detém os dados que foram analisados.

  • Se o perfil de dados for para um Google Cloud recurso, este é o ID do projeto que contém os dados.
  • Se o perfil de dados for para um contentor do Amazon S3, este é o ID da conta da AWS que contém o contentor.
  • Se o perfil de dados for para um contentor do Azure Blob Storage, este é o ID da subscrição do Azure que contém o contentor.
Público

Se esta loja de ficheiros está disponível para todos os utilizadores ou restrita a determinados utilizadores.

Etiquetas de recursos

Etiquetas que o arquivo de ficheiros tinha no momento em que o perfil foi gerado.

Etiquetas de recursos

Etiquetas que o arquivo de ficheiros tinha no momento em que o perfil foi gerado.

Localização do recurso

Região ou várias regiões que contêm o armazenamento de ficheiros.

Se tiver analisado um contentor do Cloud Storage de duas regiões, este valor depende de se o contentor está armazenado numa região dupla predefinida:

  • Para regiões duplas predefinidas, a proteção de dados confidenciais define este valor para o nome da região dupla predefinida.
  • Para regiões duplas padrão, o Sensitive Data Protection define este valor para a região múltipla que contém as regiões duplas. Para ver informações sobre como as regiões são mapeadas para várias regiões, consulte o artigo Regiões duplas.
Nome do recurso

Nome totalmente qualificado do perfil de dados.

Estado

Indicação de se o perfil foi gerado com êxito.

Resumos de clusters de ficheiros

Quando é gerado um perfil de dados de armazenamento de ficheiros, os ficheiros são agrupados em clusters de ficheiros. A Proteção de dados confidenciais fornece um resumo para cada cluster de ficheiros.

Cada resumo de cluster de ficheiros tem os seguintes campos:

Risco de dados
Nível de risco associado aos dados neste cluster de ficheiros. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
Erros
Quaisquer erros detetados quando o perfil de dados da loja do ficheiro foi gerado.
Extensões de ficheiros analisadas
Lista de tipos de ficheiros detetados e analisados para gerar o perfil de dados da loja de ficheiros.
Extensões de ficheiros vistas
Lista de tipos de ficheiros detetados, mas não necessariamente analisados.
InfoTypes
Lista de infoTypes incorporados e personalizados que foram detetados neste cluster de ficheiros.
Sensibilidade
Pontuação que indica o nível de confidencialidade deste cluster de ficheiros. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
Tipo

Indica a categoria dos ficheiros neste cluster. Para mais informações sobre todos os clusters de ficheiros suportados, consulte o artigo Clusters de ficheiros suportados em operações de descoberta.