Este documento descreve a sintaxe para a pesquisa de palavras-chave do Dataplex Universal Catalog, bem como as pesquisas de IA em linguagem natural.
O Dataplex Universal Catalog permite-lhe descobrir, catalogar centralmente, gerir e compreender os dados da sua organização. Para encontrar eficientemente recursos de dados específicos no seu catálogo de dados, pode usar consultas de pesquisa eficazes. A sintaxe das consultas de pesquisa inclui:
- Pesquisa simples: como encontrar recursos de dados através de um único termo de pesquisa.
- Predicados qualificados: como refinar a sua pesquisa através de campos de metadados específicos, como o nome, a localização ou a descrição.
- Pesquisa de aspetos: como pesquisar entradas com base nos respetivos metadados técnicos e da empresa anexados.
- Operadores lógicos: como combinar vários critérios de pesquisa com os operadores AND e OR para criar consultas complexas. Compreendendo esta sintaxe, pode localizar rapidamente os dados de que precisa.
Antes de começar
Compreenda as entradas, os aspetos, os tipos de aspetos, os grupos de entradas e os tipos de entradas do Dataplex Universal Catalog. Consulte o artigo Acerca da gestão de metadados no Dataplex Universal Catalog.
O Dataplex Universal Catalog oferece dois modos de pesquisa: pesquisa por palavras-chave e pesquisa em linguagem natural (pré-visualização).
- A pesquisa de palavras-chave permite-lhe encontrar recursos através de palavras-chave específicas, filtros e uma sintaxe definida.
- A pesquisa de linguagem natural tira partido da IA para compreender consultas semânticas. Permite-lhe encontrar recursos de IA através de linguagem do dia a dia, eliminando a necessidade de sintaxe complexa.
Este documento aborda a sintaxe para a pesquisa de palavras-chave e de linguagem natural. IA Para iniciar uma consulta de pesquisa do Dataplex Universal Catalog na Google Cloud consola, aceda à página Pesquisa do Dataplex Universal Catalog e selecione Dataplex Universal Catalog como plataforma de pesquisa.
Para mais informações, consulte o artigo Pesquise recursos no Dataplex Universal Catalog.
Pesquisa de texto livre
Pode encontrar recursos introduzindo um termo ou uma expressão sem sintaxe específica. O Dataplex Universal Catalog faz uma pesquisa ampla fazendo corresponder a sua consulta a vários campos de metadados, incluindo o seguinte:
- Nome, nome a apresentar ou descrição de um recurso
- Tipo de recurso
- ID do projeto
- Descrição da vista geral
- Nome da coluna (ou nome da coluna aninhada) no esquema de um recurso
- Descrição da coluna
- Nome totalmente qualificado
- Contactos
- Aspetos
Pesquise com a sintaxe de consulta
Para pesquisas mais precisas, pode criar uma consulta com uma sintaxe específica, incluindo qualificadores, operadores lógicos e pesquisas de aspetos.
Predicados qualificados
Pode qualificar um predicado prefixando-o com uma chave que restringe a correspondência a um metadado específico:
- Um sinal de igual (
=
) restringe a pesquisa a uma correspondência exata. - Um sinal de dois pontos (
:
) após a chave faz corresponder o predicado a uma subcadeia de carateres ou a um token no valor nos resultados da pesquisa.
A tokenização divide a stream de texto numa série de tokens, com cada token a corresponder normalmente a uma única palavra.
Por exemplo:
name:foo
seleciona recursos com nomes que contêm a substringfoo
, comofoo1
ebarfoo
.description:foo
seleciona recursos com o tokenfoo
na descrição, comobar
efoo
.location=foo
corresponde aos recursos numa localização especificada comfoo
como o nome da localização.
O comportamento destes qualificadores pode variar ligeiramente entre os modos de pesquisa, conforme detalhado nas secções seguintes.
Pesquisa de palavras-chave
As chaves de predicado type
, system
, location
e orgid
suportam apenas o qualificador de correspondência exata (=
) e não o qualificador de substring (:
). Por exemplo, type=foo
ou orgid=number
.
O Dataplex Universal Catalog suporta os seguintes qualificadores para a pesquisa de palavras-chave:
Qualificador | Descrição |
---|---|
name:x |
Corresponde a x como uma substring do ID do recurso. |
displayname:x |
Corresponde a x como uma substring do nome a apresentar do recurso. |
column:x |
Corresponde a x como uma substring do nome da coluna (ou do nome da coluna aninhada) no esquema do recurso. |
description:x |
Corresponde a x como um token na descrição do recurso. |
label:bar |
Corresponde aos recursos do BigQuery que têm uma etiqueta (com algum valor) e a chave da etiqueta tem bar como uma substring. |
label=bar |
Corresponde aos recursos do BigQuery que têm uma etiqueta (com
algum valor) e a chave da etiqueta é igual a bar como uma string. |
label:bar:x |
Corresponde a x como uma subcadeia no valor de uma etiqueta com a chave bar anexada a um recurso do BigQuery. |
label=foo:bar |
Corresponde aos recursos do BigQuery em que a chave é igual a foo e o valor da chave é igual a bar . |
label.foo=bar |
Corresponde aos recursos do BigQuery em que a chave é igual a foo e o valor da chave é igual a bar . |
label.foo |
Corresponde aos recursos do BigQuery que têm uma etiqueta cuja chave é igual a foo como uma string. |
type=TYPE |
Corresponde a recursos de um tipo de entrada específico ou ao respetivo alias de tipo. |
projectid:bar |
Faz corresponder recursos em Google Cloud projetos que correspondam a bar como uma subcadeia no ID. |
parent:x |
Corresponde a x como uma substring do caminho hierárquico de um recurso. O caminho principal é um fully_qualified_name do recurso principal. |
orgid=number |
Corresponde a recursos numa organização de Google Cloud com o valor de ID exato de number . |
system=SYSTEM |
Faz corresponder recursos de um sistema especificado. |
location=LOCATION |
Faz corresponder recursos numa localização especificada com um nome exato.
Por exemplo, Os recursos do BigQuery Omni suportam este qualificador através do nome da localização do BigQuery Omni.
Por exemplo,
|
createtime |
Encontra recursos que foram criados dentro, antes ou depois de uma determinada data ou hora. Por exemplo:
Formato de data/hora: Todas as indicações de tempo têm de estar em GMT. Os fusos horários não são suportados. As indicações de tempo parciais, os separadores de datas com hífen ( Por exemplo:
|
updatetime |
Encontra recursos que foram atualizados dentro, antes ou depois de uma determinada data ou hora. Por exemplo:
Formato de data/hora: Todas as indicações de tempo têm de estar em GMT. Os fusos horários não são suportados. As indicações de tempo parciais, os separadores de datas com hífen ( Por exemplo:
|
fully_qualified_name:x |
Corresponde a x como uma substring de fully_qualified_name . |
fully_qualified_name=x |
Corresponde a x como fully_qualified_name . |
Pesquisa de linguagem natural
IA
As chaves de predicado type
, system
, location
e description
, e a pesquisa de aspetos (excluindo has
) suportam apenas o qualificador de correspondência exata (=
) e não o qualificador de substring (:
). Por exemplo, type=foo
.
O Dataplex Universal Catalog suporta os seguintes qualificadores para a pesquisa em linguagem natural:
Qualificador | Descrição |
---|---|
name:x |
Corresponde a x como uma subcadeia do ID do recurso ou do nome a apresentar do recurso. |
displayname:x |
Corresponde a x como uma substring do nome a apresentar do recurso. |
column:x |
Corresponde a x como uma substring do nome da coluna (ou do nome da coluna aninhada) no esquema do recurso. |
description:x |
Corresponde a x como um token na descrição do recurso. |
labels:bar |
Corresponde aos recursos do BigQuery que têm uma etiqueta (com algum valor) e a chave da etiqueta tem bar como uma substring. |
labels=bar |
Corresponde aos recursos do BigQuery que têm uma etiqueta (com
algum valor) e a chave da etiqueta é igual a bar como uma string. |
labels.bar:x |
Corresponde a x como uma subcadeia no valor de uma etiqueta com a chave bar anexada a um recurso do BigQuery. |
labels.foo=bar |
Corresponde aos recursos do BigQuery em que a chave é igual a foo e o valor da chave é igual a bar . |
type=TYPE |
Corresponde a recursos de um tipo de entrada específico ou ao respetivo alias de tipo. |
projectid:bar |
Faz corresponder recursos em Google Cloud projetos que correspondam a bar como uma subcadeia no ID. |
parent:x |
Corresponde a x como uma substring do caminho hierárquico de um recurso. |
system=SYSTEM |
Faz corresponder recursos de um sistema especificado. |
location=LOCATION |
Faz corresponder recursos numa localização especificada com um nome exato.
Por exemplo, Os recursos do BigQuery Omni suportam este qualificador através do nome da localização do BigQuery Omni.
Por exemplo,
|
createtime |
Encontra recursos que foram criados dentro, antes ou depois de uma determinada data ou hora. Por exemplo:
Formato de data/hora: Todas as indicações de tempo têm de estar em GMT. Os fusos horários não são suportados. As indicações de tempo parciais, os separadores de datas com hífen ( Por exemplo:
|
updatetime |
Encontra recursos que foram atualizados dentro, antes ou depois de uma determinada data ou hora. Por exemplo:
Formato de data/hora: Todas as indicações de tempo têm de estar em GMT. Os fusos horários não são suportados. As indicações de tempo parciais, os separadores de datas com hífen ( Por exemplo:
|
Pesquisa de aspetos
Para pesquisar entradas com base nos respetivos aspetos anexados, use a seguinte sintaxe de consulta.
Pesquisa de palavras-chave
Qualificador | Descrição |
---|---|
aspect:x |
Corresponde a x como uma substring do caminho completo para o tipo de aspeto de um aspeto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID |
aspect=x |
Corresponde a x como o caminho completo para o tipo de aspeto de um aspeto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID |
aspect:xOPERATORvalue |
Pesquisa valores de campos de aspeto. Corresponde a A lista de operadores suportados depende do tipo de campo no aspeto, da seguinte forma:
Apenas os campos de nível superior do aspeto são pesquisáveis. Por exemplo, todas as consultas seguintes correspondem a entradas em que o valor
do campo
|
Pesquisa de linguagem natural
IA
Qualificador | Descrição |
---|---|
has:x |
Corresponde a x como uma substring do caminho completo para o tipo de aspeto de um aspeto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID |
has=x |
Corresponde a x como o caminho completo para o tipo de aspeto de um aspeto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID |
xOPERATORvalue |
Pesquisa valores de campos de aspeto. Corresponde a
Apenas os campos de nível superior do aspeto são pesquisáveis. |
Operadores lógicos
Uma consulta pode consistir em vários predicados com operadores lógicos. Se não especificar um operador, o operador lógico AND
é implícito. Por exemplo, foo bar
devolve recursos que correspondem ao predicado foo
e ao predicado bar
.
Os operadores lógicos AND
e OR
são suportados. Por exemplo, foo OR bar
.
Pode negar um predicado com um prefixo -
(hífen) ou NOT
. Por exemplo,
-name:foo
devolve recursos com nomes que não correspondem ao predicado foo
.
Sintaxe abreviada
Também está disponível uma sintaxe de pesquisa abreviada, que usa |
(barra vertical) para operadores OR
e ,
(vírgula) para operadores AND
.
Por exemplo, para pesquisar entradas num de vários projetos usando o operador OR
, pode usar a seguinte sintaxe abreviada:
projectid:(id1|id2|id3|id4)
A mesma pesquisa sem usar a sintaxe abreviada tem o seguinte aspeto:
projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4
Para pesquisar entradas com nomes de colunas correspondentes, use o seguinte:
- E:
column:(name1,name2,name3)
- OU:
column:(name1|name2|name3)
Esta sintaxe abreviada funciona para os predicados qualificados, exceto para label
na pesquisa de palavras-chave.
O que se segue?
- Saiba como pesquisar recursos no Dataplex Universal Catalog
- Saiba mais acerca da gestão de metadados no Dataplex Universal Catalog.
- Saiba como enriquecer as entradas com metadados através de aspetos.
- Saiba como gerir entradas e carregar origens personalizadas.