Esta página lista e descreve todas as métricas recolhidas nos perfis de dados.
Existem três tipos de perfis de dados: perfis de dados de projetos, perfis de dados de tabelas e perfis de dados de colunas.
Perfis de dados de projetos
Cada perfil de dados do projeto tem os seguintes campos. Os valores destes campos são agregados com base nos recursos analisados no projeto.
Estatísticas
Os perfis de dados do projeto fornecem as seguintes estatísticas:
- Risco de dados
- Nível de risco associado aos dados no seu estado atual. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
- Sensibilidade
- Pontuação que indica o nível de sensibilidade deste projeto. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
Metadados
Os perfis de dados do projeto fornecem os seguintes metadados:
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- ID do projeto
- ID do projeto que foi analisado.
- Nome do recurso
- Nome totalmente qualificado do perfil de dados.
- Estado
- Ícone que indica o estado da operação de criação de perfis.
Perfis de dados de tabelas
Cada perfil de dados de tabela tem os seguintes campos:
Estatísticas
Os perfis de dados de tabelas fornecem as seguintes estatísticas:
- Risco de dados
- Nível de risco associado aos dados no seu estado atual. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
- Sensibilidade
- Pontuação que indica o nível de confidencialidade desta tabela. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
Metadados
Os perfis de dados de tabelas fornecem os seguintes metadados:
- Bases de dados
- A base de dados que contém a tabela da qual foi criado um perfil. Este campo aplica-se apenas à deteção do Cloud SQL.
- ID do conjunto de dados
- ID do conjunto de dados que contém esta tabela.
- Encriptação
- Se a encriptação desta tabela é gerida pela Google ou pela sua organização.
- Período de validade
- Opcional. A hora em que esta tabela expira.
- Contagem de colunas com falhas
- O número de colunas ignoradas nesta tabela devido a um erro.
- Inspeção do resumo da configuração
- Imagem instantânea do modelo de inspeção que foi usado quando o perfil foi gerado. Para mais informações, consulte o artigo Instantâneos do perfil de dados.
- Instância
- A instância que contém a tabela da qual foi criado um perfil. Este campo aplica-se apenas à deteção do Cloud SQL.
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- Última atualização no BigQuery
- Data e hora em que esta tabela foi modificada pela última vez.
- ID do projeto
- ID do projeto que contém esta tabela.
- Público
Se esta tabela está disponível para todos os utilizadores ou restrita a determinados utilizadores.
- Etiquetas de recursos
Etiquetas que a tabela tinha no momento em que o perfil foi gerado.
- Etiquetas de recursos
Etiquetas que a tabela tinha no momento em que o perfil foi gerado.
- Nome do recurso
Nome totalmente qualificado do perfil de dados.
- Número de linhas
Número de linhas nesta tabela quando o perfil foi gerado.
- Contagem de colunas analisadas
O número de colunas analisadas nesta tabela.
- Conta de serviço
Número de contas de serviço com autorizações da IAM para aceder a esta tabela.
- Estado
Indicação de se o perfil foi gerado com êxito.
- ID da tabela
ID desta tabela.
- Hora de criação da tabela
Data e hora em que a tabela foi criada.
- Tamanho da tabela
O tamanho desta tabela quando o perfil foi gerado.
- Tipo
O tipo de descoberta realizada.
Perfis de dados de colunas
Cada perfil de dados de coluna tem os seguintes campos:
Estatísticas
Os perfis de dados das colunas fornecem as seguintes estatísticas:
- Risco de dados
- Nível de risco associado aos dados no seu estado atual. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
- Sensibilidade
- Pontuação que indica o nível de confidencialidade desta coluna. Para mais informações, consulte os níveis de sensibilidade e risco de dados.
- infoType previsto
Se um único infoType incorporado ou personalizado predominar claramente sobre os outros na coluna, a proteção de dados confidenciais define este campo para esse infoType. Caso contrário, este campo não tem valor.
Para ver uma lista de todos os infoTypes detetados na coluna, consulte o campo Outros infoTypes.
A proteção de dados confidenciais procura apenas os infoTypes que especificou no modelo de inspeção. Assim, apenas esses infoTypes podem aparecer no campo infoType previsto. Por exemplo, se a coluna tiver endereços de email, mas não incluiu o detetor infoType
EMAIL_ADDRESS
no modelo de inspeção, este campo não contémEMAIL_ADDRESS
.Se os dados da coluna corresponderem predominantemente a vários infoTypes estreitamente relacionados que pertencem à mesma categoria geral, a Proteção de dados confidenciais define este campo para o infoType mais geral. Por exemplo, se a coluna tiver predominantemente uma combinação de infoTypes
PASSPORT
,AUSTRALIA_PASSPORT
eCANADA_PASSPORT
, o campo Predicted infoType é definido comoPASSPORT
. O campo Outros tipos de informações mostra os tipos de informações mais específicos e a respetiva prevalência estimada.- Outros infoTypes
InfoTypes detetados na coluna que não têm um sinal suficientemente forte para serem considerados o infoType previsto dessa coluna. Neste documento, consulte a secção Predicted infoType.
Para perfis de dados gerados após 13 de outubro de 2022, cada infoType apresentado neste campo tem uma prevalência estimada. A prevalência estimada é uma percentagem aproximada de linhas não nulas nas quais o infoType foi detetado.
Por exemplo, suponhamos que tem uma coluna com as seguintes métricas:
- infoType previsto:
FDA_CODE
- Outros tipos de informações:
PERSON_NAME (2%)
eSTREET_ADDRESS (1%)
Neste exemplo, existe uma forte indicação de que a coluna contém códigos da FDA. A proteção de dados confidenciais também determinou que aproximadamente 2% das linhas não nulas na coluna podem conter nomes de pessoas e 1% pode conter moradas.
A proteção de dados confidenciais procura apenas os infoTypes que especificou no modelo de inspeção. Assim, apenas esses infoTypes podem aparecer no campo Outros infoTypes. Por exemplo, se a coluna tiver endereços de email, mas não tiver incluído o detetor
EMAIL_ADDRESS
infoType no modelo de inspeção, este campo não contémEMAIL_ADDRESS
.- infoType previsto:
- Proporção nula estimada
Proporção aproximada de valores nulos nesta coluna, categorizada como alta, média, baixa ou muito baixa. Este valor é elevado se uma grande proporção de entradas nesta coluna for nula.
- Unicidade estimada
Uma estimativa da quantidade de dados únicos nesta coluna, categorizada como alta, média ou baixa. Um nível de unicidade elevado sugere que a coluna contém valores distintos. Uma elevada presença de valores únicos pode indicar que a coluna contém identificadores.
Um nível de unicidade baixo sugere que a coluna contém muitos valores comuns, como enumerações ou valores booleanos.
Se a proteção de dados confidenciais determinar que não existem linhas suficientes na tabela para calcular esta métrica, este valor fica em branco.
- Pontuação de texto livre
A probabilidade de esta coluna conter texto de forma livre. Um valor próximo de 1 indica que é provável que a coluna contenha texto de forma livre ou em linguagem natural. Os valores possíveis variam de 0 a 1.
Uma pontuação de texto livre elevada pode aumentar os níveis de risco e sensibilidade dos dados de uma coluna.
Metadados
Os perfis de dados das colunas fornecem os seguintes metadados:
- Bases de dados
- A base de dados que contém a coluna da tabela da qual foi criado um perfil. Este campo aplica-se apenas à descoberta do Cloud SQL.
- Tipo de dados
- O tipo de dados dos conteúdos desta coluna.
- ID do conjunto de dados
- ID do conjunto de dados que contém esta coluna da tabela.
- ID do campo
- Nome da coluna.
- Instância
- A instância que contém a coluna da tabela da qual foram criados perfis. Este campo aplica-se apenas à descoberta do Cloud SQL.
- Localização da instância
- Localização da instância que contém a coluna da tabela da qual foram criados perfis. Este campo aplica-se apenas à deteção do Cloud SQL.
- Último perfil gerado
- Data e hora em que o perfil foi gerado pela última vez.
- Etiquetas de políticas
- Indica se uma etiqueta de política é aplicada à coluna. Para informações sobre as práticas recomendadas para usar etiquetas de políticas, consulte o artigo Usar etiquetas de políticas no BigQuery.
- ID do projeto
- ID do projeto que contém esta coluna da tabela.
- Nome do recurso
- Nome totalmente qualificado do perfil de dados.
- Estado
- Ícone que indica o estado da operação de criação de perfis.
- ID da tabela
- ID da tabela que contém esta coluna.
Ficheiros de perfis de dados de lojas
A Proteção de dados confidenciais usa o termo armazenamento de ficheiros para se referir a um contentor ou um bucket de armazenamento de ficheiros.
Cada perfil de dados de armazenamento de ficheiros tem os seguintes campos.
Estatísticas
Os perfis de dados de lojas de ficheiros fornecem as seguintes estatísticas:
- Risco de dados
- Nível de risco associado aos dados no seu estado atual. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
- Conjuntos de ficheiros
- Fornece um resumo para cada cluster de ficheiros que foi detetado quando este arquivo de ficheiros foi analisado. Para mais informações sobre cada resumo, consulte a secção Resumos de clusters de ficheiros nesta página.
- Sensibilidade
- Pontuação que indica o nível de confidencialidade desta loja de ficheiros. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
Metadados
Os perfis de dados de lojas de ficheiros fornecem os seguintes metadados:
- Localizações de armazenamento de dados
Se tiver criado um perfil de um contentor do Cloud Storage de duas regiões, este campo apresenta as duas regiões.
Se tiver criado um perfil de um arquivo de ficheiros de outro fornecedor de nuvem, este valor é a região onde o fornecedor de nuvem armazena o arquivo de ficheiros.
- Encriptação
Se a encriptação para este armazenamento de ficheiros é gerida pela Google ou pela sua organização.
- Tipo de armazenamento de ficheiros
A origem dos dados analisados: Cloud Storage, Amazon S3 ou Azure Blob Storage.
- Caminho da loja de ficheiros
O nome da loja de ficheiros.
- Inspeção do resumo da configuração
Imagem instantânea do modelo de inspeção que foi usado quando o perfil foi gerado. Para mais informações, consulte o artigo Capturas instantâneas do perfil de dados.
- Tipo de localização
Tipo de localização onde o arquivo de ficheiros está armazenado:
region
,dual-region
oumulti-region
.- Perfil criado pela primeira vez
Data e hora em que o perfil foi criado pela primeira vez.
- Perfil gerado pela última vez
Data e hora da última geração do perfil.
- ID superior
O recurso que detém os dados que foram analisados.
- Se o perfil de dados for para um Google Cloud recurso, este é o ID do projeto que contém os dados.
- Se o perfil de dados for para um contentor do Amazon S3, este é o ID da conta da AWS que contém o contentor.
- Se o perfil de dados for para um contentor do Azure Blob Storage, este é o ID da subscrição do Azure que contém o contentor.
- Público
Se esta loja de ficheiros está disponível para todos os utilizadores ou restrita a determinados utilizadores.
- Etiquetas de recursos
Etiquetas que o arquivo de ficheiros tinha no momento em que o perfil foi gerado.
- Etiquetas de recursos
Etiquetas que o arquivo de ficheiros tinha no momento em que o perfil foi gerado.
- Localização do recurso
Região ou várias regiões que contêm o armazenamento de ficheiros.
Se tiver analisado um contentor do Cloud Storage de duas regiões, este valor depende de se o contentor está armazenado numa região dupla predefinida:
- Para regiões duplas predefinidas, a proteção de dados confidenciais define este valor para o nome da região dupla predefinida.
- Para regiões duplas padrão, o Sensitive Data Protection define este valor para a região múltipla que contém as regiões duplas. Para ver informações sobre como as regiões são mapeadas para várias regiões, consulte o artigo Regiões duplas.
- Nome do recurso
Nome totalmente qualificado do perfil de dados.
- Estado
Indicação de se o perfil foi gerado com êxito.
Resumos de clusters de ficheiros
Quando é gerado um perfil de dados de armazenamento de ficheiros, os ficheiros são agrupados em clusters de ficheiros. A Proteção de dados confidenciais fornece um resumo para cada cluster de ficheiros.
Cada resumo de cluster de ficheiros tem os seguintes campos:
- Risco de dados
- Nível de risco associado aos dados neste cluster de ficheiros. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
- Erros
- Quaisquer erros detetados quando o perfil de dados da loja do ficheiro foi gerado.
- Extensões de ficheiros analisadas
- Lista de tipos de ficheiros detetados e analisados para gerar o perfil de dados da loja de ficheiros.
- Extensões de ficheiros vistas
- Lista de tipos de ficheiros detetados, mas não necessariamente analisados.
- InfoTypes
- Lista de infoTypes incorporados e personalizados que foram detetados neste cluster de ficheiros.
- Sensibilidade
- Pontuação que indica o nível de confidencialidade deste cluster de ficheiros. Para mais informações, consulte o artigo Níveis de sensibilidade e risco de dados.
- Tipo
Indica a categoria dos ficheiros neste cluster. Para mais informações sobre todos os clusters de ficheiros suportados, consulte o artigo Clusters de ficheiros suportados em operações de descoberta.