Este guia de início rápido apresenta a API Entity Reconciliation. Neste guia de início rápido, você vai usar o console Google Cloud para configurar o projeto e a autenticação doGoogle Cloud , criar arquivos de mapeamento de esquema e fazer uma solicitação para que o Enterprise Knowledge Graph execute um job de reconciliação de entidades.
Criar um job de reconciliação de entidade
Siga estas etapas para criar um job de reconciliação de entidades:
REST
Para criar um job simples com uma tabela de origem (remoção de duplicação), chame o método projects.locations.entityReconciliationJobs.create.
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o ID do projeto do Google Cloud .
- LOCATION: local do gráfico de conhecimento.
- Opções:
global- endpoint global
- Opções:
- DATASET_ID: ID do conjunto de dados do BigQuery
- TABLE_ID: ID da tabela do BigQuery
- MAPPING_FILE_URI: caminho do Cloud Storage para um arquivo de mapeamento no formato YAML.
- Exemplo:
gs://ekg-test-gcs/mapping.yml
- Exemplo:
- ENTITY_TYPE: tipo de entidade para conciliação.
Método HTTP e URL:
POST https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs
Corpo JSON da solicitação:
{
"inputConfig": {
"bigqueryInputConfigs": [
{
"bigqueryTable": "projects/PROJECT_ID/datasets/DATASET_ID/tables/TABLE_ID",
"gcsUri": "MAPPING_FILE_URI"
}
],
"entityType": "ENTITY_TYPE"
},
"outputConfig": {
"bigqueryDataset": "projects/PROJECT_ID/datasets/DATASET_ID"
}
}
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando abaixo:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs"
PowerShell
Salve o corpo da solicitação em um arquivo com
o nome request.json e execute o comando abaixo:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs" | Select-Object -Expand Content
Você receberá uma resposta JSON semelhante a esta:
{
"name": "projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID",
"inputConfig": {
"bigqueryInputConfigs": [
{
"bigqueryTable": "projects/PROJECT_ID/datasets/DATASET_ID/tables/TABLE_ID",
"gcsUri": "MAPPING_FILE_URI"
}
],
"entityType": "ENTITY_TYPE"
},
"outputConfig": {
"bigqueryDataset": "projects/PROJECT_ID/datasets/DATASET_ID"
},
"state": "JOB_STATE_RUNNING",
"createTime": "2021-07-31T14:39:14.145568Z",
"updateTime": "2021-07-31T14:39:14.145568Z"
}
{
"inputConfig": {
"bigqueryInputConfigs": [
{
"bigqueryTable": "projects/PROJECT_ID/datasets/DATASET_ID/tables/TABLE_ID",
"gcsUri": "MAPPING_FILE_URI"
},
{
"bigqueryTable": "projects/PROJECT_ID/datasets/DATASET_ID/tables/TABLE_ID",
"gcsUri": "MAPPING_FILE_URI"
}
],
"entityType": "ENTITY_TYPE",
"previousResultBigqueryTable": "projects/PROJECT_ID/datasets/DATASET_ID/tables/clusters_13689265293502324307"
},
"outputConfig": {
"bigqueryDataset": "projects/PROJECT_ID/datasets/DATASET_ID"
},
"reconConfig": {
"affinityClusteringConfig": {
"compressionRoundCount": "2"
},
"options": {
"enableGeocodingSeparation": true
}
}
}
Python
Para mais informações, consulte a documentação de referência da API Enterprise Knowledge Graph Python.
Para autenticar no Enterprise Knowledge Graph, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Receber um job de reconciliação de entidade
REST
Para recuperar o status do job da API, chame o método projects.locations.entityReconciliationJobs.get.
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o ID do projeto do Google Cloud .
- LOCATION: local do gráfico de conhecimento.
- Opções:
global- endpoint global
- Opções:
- JOB_ID: ID do job de reconciliação de entidades.
- Exemplo:
2628838070002699773
- Exemplo:
Método HTTP e URL:
GET https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID
Para enviar a solicitação, escolha uma destas opções:
curl
Execute o seguinte comando:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID"
PowerShell
Execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID" | Select-Object -Expand Content
Você receberá uma resposta JSON semelhante a esta:
{
"name": "projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID",
"inputConfig": {
"bigqueryInputConfigs": [
{
"bigqueryTable": "projects/PROJECT_ID/datasets/DATASET_ID/tables/TABLE_ID",
"gcsUri": "MAPPING_FILE_URI"
}
],
"entityType": "ENTITY_TYPE"
},
"outputConfig": {
"bigqueryDataset": "projects/PROJECT_ID/datasets/DATASET_ID"
},
"state": "JOB_STATE_SUCCEEDED",
"createTime": "2021-07-31T14:39:14.145568Z",
"updateTime": "2021-07-31T14:39:14.145568Z"
}
Python
Para mais informações, consulte a documentação de referência da API Enterprise Knowledge Graph Python.
Para autenticar no Enterprise Knowledge Graph, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Listar jobs de reconciliação de entidade
REST
Para recuperar todos os jobs da API, chame o método projects.locations.entityReconciliationJobs.list.
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o ID do projeto do Google Cloud .
- LOCATION: local do gráfico de conhecimento.
- Opções:
global- endpoint global
- Opções:
Método HTTP e URL:
GET https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs
Para enviar a solicitação, escolha uma destas opções:
curl
Execute o seguinte comando:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs"
PowerShell
Execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs" | Select-Object -Expand Content
Você receberá uma resposta JSON semelhante a esta:
{
"entityReconciliationJobs": [
{
"name": "projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID",
"inputConfig": {
"bigqueryInputConfigs": [
{
"bigqueryTable": "projects/PROJECT_ID/datasets/DATASET_ID/tables/TABLE_ID",
"gcsUri": "MAPPING_FILE_URI"
}
],
"entityType": "ENTITY_TYPE"
},
"outputConfig": {
"bigqueryDataset": "projects/PROJECT_ID/datasets/DATASET_ID"
},
"state": "JOB_STATE_SUCCEEDED",
"createTime": "2021-07-31T14:39:14.145568Z",
"updateTime": "2021-07-31T14:39:14.145568Z"
}
],
"nextPageToken": ""
}
Python
Para mais informações, consulte a documentação de referência da API Enterprise Knowledge Graph Python.
Para autenticar no Enterprise Knowledge Graph, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Cancelar um job de reconciliação de entidade
REST
Para interromper um job em execução na API, chame o método projects.locations.entityReconciliationJobs.cancel.
O Enterprise Knowledge Graph interrompe o job na primeira oportunidade. O cancelamento de um job é feito da melhor maneira possível. Não há garantia de que o comando cancel vai funcionar.
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o ID do projeto do Google Cloud .
- LOCATION: local do gráfico de conhecimento.
- Opções:
global- endpoint global
- Opções:
- JOB_ID: ID do job de reconciliação de entidades.
- Exemplo:
2628838070002699773
- Exemplo:
Método HTTP e URL:
POST https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID:cancel
Para enviar a solicitação, escolha uma destas opções:
curl
Execute o seguinte comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d "" \
"https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID:cancel"
PowerShell
execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-Uri "https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID:cancel" | Select-Object -Expand Content
Você receberá um código de status bem-sucedido (2xx) e uma resposta vazia.
Python
Para mais informações, consulte a documentação de referência da API Enterprise Knowledge Graph Python.
Para autenticar no Enterprise Knowledge Graph, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Excluir um job de reconciliação de entidade
REST
Para remover um job concluído ou com falha usando a API, chame o método projects.locations.entityReconciliationJobs.delete.
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT_ID: o ID do projeto do Google Cloud .
- LOCATION: local do gráfico de conhecimento.
- Opções:
global- endpoint global
- Opções:
- JOB_ID: ID do job de reconciliação de entidades.
- Exemplo:
2628838070002699773
- Exemplo:
Método HTTP e URL:
DELETE https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID
Para enviar a solicitação, escolha uma destas opções:
curl
Execute o seguinte comando:
curl -X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID"
PowerShell
execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method DELETE `
-Headers $headers `
-Uri "https://enterpriseknowledgegraph.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/entityReconciliationJobs/JOB_ID" | Select-Object -Expand Content
Você receberá um código de status bem-sucedido (2xx) e uma resposta vazia.
Python
Para mais informações, consulte a documentação de referência da API Enterprise Knowledge Graph Python.
Para autenticar no Enterprise Knowledge Graph, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.