Monitorar fichas de empresa

Como provedor de dados, você pode rastrear as métricas de uso das suas listagens. Há dois métodos para ver as métricas de uso dos dados compartilhados:

  • Use o BigQuery Sharing (antigo Analytics Hub). Com o compartilhamento, você pode ver o painel de métricas de uso das suas listagens, que inclui assinaturas diárias, jobs executados diariamente, número de assinantes de cada organização e frequência de jobs para cada tabela. As métricas de uso dos dados compartilhados são recuperadas consultando a visualização INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

  • Use a visualização INFORMATION_SCHEMA: É possível rastrear como os assinantes usam seus conjuntos de dados consultando diretamente a visualização INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Usar o Compartilhamento

Para ver as métricas de uso dos seus dados compartilhados com o recurso de compartilhamento, siga estas etapas:

  1. No console Google Cloud , acesse a página Compartilhamento (Analytics Hub).

    Acessar Compartilhamento (Analytics Hub)

  2. Clique no nome da troca de dados que contém a listagem com as métricas de uso que você quer ver.

  3. Clique em Métricas de uso e faça o seguinte:

    1. No menu Fichas, selecione a ficha.

    2. Defina o período.

A página exibe as seguintes métricas de uso:

  • Total de assinaturas: o número de assinaturas atuais na listagem selecionada. Você pode ver o total de assinaturas por até 60 dias.
  • Total de assinantes: o número de assinantes únicos em todas as assinaturas na página de detalhes selecionada. É possível ver o total de inscritos por até 60 dias.
  • Total de jobs executados: o número de jobs exclusivos executados em cada tabela da página de detalhes selecionada.
  • Total de bytes verificados: o número total de bytes verificados de todas as tabelas da listagem selecionada.
  • Assinaturas diárias: o gráfico que rastreia o número de assinaturas da listagem selecionada durante um período. É possível ver assinaturas diárias de até 60 dias.
  • Assinantes por organização: lista as organizações e o número de assinantes que consomem as listas selecionadas.
  • Jobs executados diariamente: este gráfico exibe o consumo de jobs da página de detalhes selecionada.
  • Frequência de job das tabelas: a frequência com que as tabelas são acessadas na listagem selecionada.

Usar a visualização INFORMATION_SCHEMA

Se você for um provedor de dados, poderá rastrear como os assinantes usam seus conjuntos de dados consultando a visualização INFORMATION_SCHEMA.SHARED_DATASET_USAGE. Verifique se você tem o papel necessário para consultar essa visualização.

Para executar a consulta em um projeto diferente do projeto padrão, adicione o ID do projeto no seguinte formato:

PROJECT_ID.region-REGION_NAME.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Por exemplo, myproject.region-us.INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Os exemplos a seguir descrevem como consultar as métricas de uso consultando a visualização INFORMATION_SCHEMA:

Ver o número total de jobs executados em todas as tabelas compartilhadas

O exemplo a seguir calcula o total de jobs executados por assinantes em um projeto:

SELECT
  COUNT(DISTINCT job_id) AS num_jobs
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

O resultado será semelhante ao seguinte:

+------------+
| num_jobs   |
+------------+
| 1000       |
+------------+

Para verificar o total de jobs executados pelos assinantes, use a cláusula WHERE:

  • Para conjuntos de dados, use WHERE dataset_id = "...".
  • Para tabelas, use WHERE dataset_id = "..." AND table_id = "...".

Acessar a tabela mais usada com base no número de linhas processadas

A consulta a seguir calcula a tabela mais usada com base no número de linhas processadas pelos assinantes.

SELECT
  dataset_id,
  table_id,
  SUM(num_rows_processed) AS usage_rows
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1,
  2
ORDER BY
  3 DESC
LIMIT
  1

O resultado será assim:

+---------------+-------------+----------------+
| dataset_id    | table_id      | usage_rows     |
+---------------+-------------+----------------+
| mydataset     | mytable     | 15             |
+---------------+-------------+----------------+

Encontrar as principais organizações que consomem suas tabelas

A consulta a seguir calcula os principais assinantes com base no número de bytes processados nas tabelas. Também é possível usar a coluna num_rows_processed como métrica.

SELECT
  subscriber_org_number,
  ANY_VALUE(subscriber_org_display_name) AS subscriber_org_display_name,
  SUM(total_bytes_processed) AS usage_bytes
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1

O resultado será assim:

+--------------------------+--------------------------------+----------------+
|subscriber_org_number     | subscriber_org_display_name    | usage_bytes    |
+-----------------------------------------------------------+----------------+
| 12345                    | myorganization                 | 15             |
+--------------------------+--------------------------------+----------------+

Para assinantes sem uma organização, use job_project_number em vez de subscriber_org_number.

Receber métricas de uso para sua troca de dados

Se a troca de dados e o conjunto de dados de origem estiverem em projetos diferentes, siga estas etapas para visualizar as métricas de uso da troca de dados:

  1. Encontre todas as listagens que pertencem à sua troca de dados.
  2. Recupere o conjunto de dados de origem anexado à página de detalhes.
  3. Para visualizar as métricas de uso da sua troca de dados, use a seguinte consulta:
SELECT
  *
FROM
  source_project_1.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"
UNION ALL
SELECT
  *
FROM
  source_project_2.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"

Receber métricas de uso para visualizações compartilhadas

A consulta a seguir mostra as métricas de uso de todas as visualizações compartilhadas em um projeto:

SELECT
  project_id,
  dataset_id,
  table_id,
  num_rows_processed,
  total_bytes_processed,
  shared_resource_id,
  shared_resource_type,
  referenced_tables
FROM `myproject`.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE shared_resource_type = 'VIEW'

O resultado será assim:

+---------------------+----------------+----------+--------------------+-----------------------+--------------------+----------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
|     project_id      |   dataset_id   | table_id | num_rows_processed | total_bytes_processed | shared_resource_id | shared_resource_type |                                                                                                              referenced_tables                                                                                                              |
+---------------------+----------------+----------+--------------------+-----------------------+--------------------+----------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
|     myproject       | source_dataset | view1    |                  6 |                    38 | view1              | VIEW                 | [{"project_id":"myproject","dataset_id":"source_dataset","table_id":"test_table","processed_bytes":"21"},
{"project_id":"bq-dataexchange-exp","dataset_id":"other_dataset","table_id":"other_table","processed_bytes":"17"}]                 |

+---------------------+----------------+----------+--------------------+-----------------------+--------------------+----------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

Receber métricas de uso para funções com valor de tabela compartilhadas

A consulta a seguir mostra as métricas de uso de todas as funções com valores de tabela compartilhada em um projeto:

SELECT
  project_id,
  dataset_id,
  table_id,
  num_rows_processed,
  total_bytes_processed,
  shared_resource_id,
  shared_resource_type,
  referenced_tables
FROM `myproject`.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE shared_resource_type = 'TABLE_VALUED_FUNCTION'

O resultado será assim:

+---------------------+----------------+----------+--------------------+-----------------------+--------------------+-----------------------+---------------------------------------------------------------------------------------------------------------------+
|     project_id      |   dataset_id   | table_id | num_rows_processed | total_bytes_processed | shared_resource_id | shared_resource_type  |                                                  referenced_tables                                                  |
+---------------------+----------------+----------+--------------------+-----------------------+--------------------+-----------------------+---------------------------------------------------------------------------------------------------------------------+
|     myproject       | source_dataset |          |                  3 |                    45 | provider_exp       | TABLE_VALUED_FUNCTION | [{"project_id":"myproject","dataset_id":"source_dataset","table_id":"test_table","processed_bytes":"45"}]           |
+---------------------+----------------+----------+--------------------+-----------------------+--------------------+-----------------------+---------------------------------------------------------------------------------------------------------------------+

A seguir