Este documento descreve como acessar e visualizar registros de pipeline e registros de serviço do Cloud Data Fusion.
A partir da versão 6.11 do Cloud Data Fusion, os registros de pipeline e de serviço estão disponíveis no Cloud Logging.
Sobre os tipos de registro
O Cloud Data Fusion gera vários tipos de registros para ajudar a monitorar e solucionar problemas de processos de integração de dados:
Preços
O uso do Cloud Logging e do Cloud Monitoring gera cobranças. Para mais informações, consulte Preços de observabilidade do Google Cloud.
Opcional: importar o painel do Cloud Data Fusion Logging
Para visualizar registros de pipeline e de serviço usando o painel do Cloud Data Fusion Logging, importe o painel:
No Google Cloud console, acesse a página Painéis do Cloud Monitoring.
Clique em Visualizar modelos de painel.
Pesquise Cloud Data Fusion Logging e selecione o painel.
Clique em Adicionar o painel do Cloud Data Fusion Logging à sua lista.
Visualizar registros de pipeline
É possível visualizar registros de pipeline usando o painel de geração de registros do Cloud Data Fusion ou diretamente na Análise de registros.
Visualizar registros de pipeline usando o painel
Se ainda não tiver feito isso, importe o painel Cloud Data Fusion Logging.
Na seção Meus painéis, clique em Cloud Data Fusion Logging.
Na seção Registros de pipeline, confira a lista de registros de pipeline. É possível filtrar os registros por gravidade, nomes de campos e valores.
Para refinar a pesquisa usando consultas, use a Análise de registros.
Visualizar registros de pipeline na Análise de registros
No Google Cloud console do, acesse a página Análise de registros.
Digite a seguinte consulta:
resource.type="datafusion.googleapis.com/PipelineV2"Isso mostra a lista de registros de pipeline. É possível usar filtros para refinar os resultados.
Filtrar registros de pipeline
É possível filtrar registros de pipeline por ID de execução, ID da instância, ID do pipeline, local, namespace ou rótulos personalizados.
Cada execução do pipeline do Cloud Data Fusion recebe um RunID exclusivo.
Depois de implantar e executar o pipeline, é possível encontrar o RunID do pipeline e visualizar os registros de pipeline correspondentes.
Para filtrar registros de pipeline por RunID, siga estas etapas:
No Google Cloud console do, acesse a página Análise de registros.
Digite a seguinte consulta:
resource.type="datafusion.googleapis.com/PipelineV2" resource.labels.run_id=RUN_ID
Visualizar registros de serviço
É possível visualizar registros de serviço usando o painel do Cloud Data Fusion Logging ou na Análise de registros.
Visualizar registros de serviço usando o painel
Se ainda não tiver feito isso, importe o painel Cloud Data Fusion Logging.
Na seção Meus painéis, clique em Cloud Data Fusion Logging.
Na seção Registros de serviço, confira a lista de registros de serviço. É possível filtrar os registros por gravidade, nomes de campos e valores.
Para refinar a pesquisa usando consultas, use a Análise de registros.
Visualizar registros de serviço na Análise de registros
A partir da versão 6.11.1.1 do Cloud Data Fusion, os registros de serviço do sistema
usam o InstanceV3 recurso monitorado (datafusion.googleapis.com/InstanceV3)
por padrão. Esses registros usam o services-v3 sufixo de nome de registro e não incluem
os rótulos org_id ou namespace encontrados na versão anterior. Embora a emissão de registros
InstanceV2 esteja desativada por padrão para instâncias novas e atualizadas,
é possível reativar o registro InstanceV2 usando a
API REST do Cloud Data Fusion se suas operações dependem dos rótulos
legados.
Para visualizar registros de serviço na Análise de registros, siga estas etapas:
No Google Cloud console do, acesse a página Análise de registros.
Encontre os registros de serviço inserindo a consulta específica para esse serviço.
Nome do serviço Consulta de registro para InstanceV2 Consulta de registro para InstanceV3 Appfabric resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="appfabric"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="appfabric"
Processador do AppFabric resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="appfabric.processor"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="appfabric.processor"
Executor de conjunto de dados resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="dataset.executor"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="dataset.executor"
Log Saver resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="log.saver"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="log.saver"
Serviço de metadados resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="metadata.service"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="metadata.service"
Métricas resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="metrics"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="metrics"
Pipeline Studio resource.type="datafusion.googleapis.com/InstanceV2" resource.labels.namespace="system" labels.".userserviceid"="studio"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".userserviceid"="studio"
Ambiente de execução resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="runtime"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="runtime"
Serviço Wrangler resource.type="datafusion.googleapis.com/InstanceV2" resource.labels.namespace="system" labels.".applicationId"="dataprep" labels.".userserviceid"="service"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".applicationId"="dataprep" labels.".userserviceid"="service"
Ativar registros do InstanceV2
Por padrão, as instâncias do Cloud Data Fusion que executam a versão 6.11.1.1 ou mais recente desativam o registro InstanceV2. Se as operações exigirem o formato de registro anterior (por exemplo, se você depender dos rótulos org_id ou namespace), será possível reativar os registros InstanceV2 usando a API REST do Cloud Data Fusion.
Para ativar os registros InstanceV2, use o
instances.patch
método com enable_instance_v2_logs definido como true. Essa configuração emite registros InstanceV2 e InstanceV3.
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-GFE-SSL: yes" \
-H "Host: datafusion.googleapis.com" \
-d '{"loggingConfig": {"enable_instance_v2_logs": true}}' \
"https://datafusion.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=loggingConfig"
Substitua:
PROJECT_ID: o Google Cloud ID do projetoLOCATION: o local da instânciaINSTANCE_ID: o ID da instância do Cloud Data Fusion
Registro configurável no Cloud Data Fusion
O Cloud Data Fusion 6.11.0 oferece registro configurável, com o Cloud Logging ativado por padrão. Embora seja possível desativar o Cloud Logging, é recomendável mantê-lo ativado para garantir o acesso a registros críticos de pipeline e instância.
Para desativar o Cloud Logging, execute o seguinte comando:
echo '{ "loggingConfig": {"instance_cloud_logging_disabled": "true"}}' | curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
--data @- \
"https://datafusion.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=$INSTANCE_ID?updateMask=logging_config"
Substitua:
PROJECT_ID: o Google Cloud ID do projetoLOCATION: o local da instânciaINSTANCE_ID: o ID da instância do Cloud Data Fusion
A seguir
- Saiba mais sobre os registros de auditoria do Cloud Data Fusion.
- Saiba como visualizar registros avançados de pipeline.