Este documento descreve a sintaxe da pesquisa por palavras-chave do Dataplex Universal Catalog e das pesquisas de IA em linguagem natural.
Com o Dataplex Universal Catalog, é possível descobrir, catalogar, gerenciar e entender os dados da sua organização de maneira centralizada. Para encontrar recursos de dados específicos no catálogo de dados com eficiência, use consultas de pesquisa avançadas. A sintaxe das consultas de pesquisa inclui:
- Pesquisa simples: como encontrar recursos de dados usando um único termo de pesquisa.
- Predicados qualificados: como refinar sua pesquisa usando campos de metadados específicos, como nome, local ou descrição.
- Pesquisa de aspectos: como pesquisar entradas com base nos metadados comerciais e técnicos anexados.
- Operadores lógicos: como combinar vários critérios de pesquisa usando AND e OR para criar consultas complexas. Ao entender essa sintaxe, você pode localizar rapidamente os dados necessários.
Antes de começar
Entenda as entradas, os aspectos, os tipos de aspecto, os grupos de entrada e os tipos de entrada do Dataplex Universal Catalog. Consulte Sobre o gerenciamento de metadados no Dataplex Universal Catalog.
O Dataplex Universal Catalog oferece dois modos de pesquisa: por palavra-chave e por linguagem natural (prévia).
- Com a pesquisa por palavra-chave, você encontra recursos usando palavras-chave, filtros e uma sintaxe definida.
- A pesquisa em linguagem natural usa a IA para entender consultas semânticas. Ele permite encontrar recursos de IA usando linguagem cotidiana, eliminando a necessidade de sintaxes complexas.
Este documento aborda a sintaxe para pesquisas por palavra-chave e em linguagem natural. IA Para iniciar uma consulta de pesquisa do Dataplex Universal Catalog no consoleGoogle Cloud , acesse a página Pesquisa do Dataplex Universal Catalog e selecione Dataplex Universal Catalog como a plataforma de pesquisa.
Para mais informações, consulte Pesquisar recursos no Dataplex Universal Catalog.
Pesquisa de texto livre
Para encontrar recursos, insira um termo ou uma frase sem sintaxe específica. O Dataplex Universal Catalog realiza uma pesquisa ampla comparando sua consulta com vários campos de metadados, incluindo:
- Nome, nome de exibição ou descrição de um recurso
- Tipo de um recurso
- ID do projeto
- Descrição da visão geral
- Nome da coluna (ou nome da coluna aninhada) no esquema de um recurso.
- Descrição da coluna
- Nome totalmente qualificado
- Contatos
- Aspectos
Pesquisar com a sintaxe de consulta
Para pesquisas mais precisas, crie uma consulta usando uma sintaxe específica, incluindo qualificadores, operadores lógicos e pesquisas de aspectos.
Predicados qualificados
Você pode qualificar um predicado usando um prefixo com uma chave que restringe a correspondência a uma parte específica dos metadados:
- Um sinal de igual (
=
) restringe a pesquisa a uma correspondência exata. - Dois pontos (
:
) após a chave correspondem ao predicado em um substring ou um token dentro do valor nos resultados da pesquisa.
A tokenização divide o fluxo de texto em uma série de tokens, cada um geralmente correspondente a uma palavra.
Exemplo:
name:foo
seleciona recursos com nomes que contêm a substringfoo
, comofoo1
ebarfoo
.description:foo
seleciona recursos com o tokenfoo
na descrição, comobar
efoo
.location=foo
corresponde a recursos em um local especificado comfoo
como nome do local.
O comportamento desses qualificadores pode variar um pouco entre os modos de pesquisa, conforme detalhado nas seções a seguir.
Pesquisa por palavra-chave
As chaves de predicado type
, system
, location
e orgid
aceitam apenas o qualificador de correspondência exata (=
), não o de substring (:
). Por exemplo, type=foo
ou orgid=number
.
O Dataplex Universal Catalog é compatível com os seguintes qualificadores para pesquisa por palavra-chave:
Qualificador | Descrição |
---|---|
name:x |
Corresponde a x como substring do ID do recurso. |
displayname:x |
Corresponda x como substring do nome de exibição do recurso. |
column:x |
Corresponde x como uma substring do nome da coluna (ou nome da coluna aninhada) no esquema do recurso. |
description:x |
Corresponde x como um token na descrição do recurso. |
label:bar |
Corresponde a recursos do BigQuery que têm um rótulo (com algum valor) e a chave de rótulo tem bar como substring. |
label=bar |
Corresponde a recursos do BigQuery que têm um rótulo (com algum valor) e a chave de rótulo é igual a bar como uma string. |
label:bar:x |
Corresponde a x como uma substring no valor de um rótulo com a chave bar anexada a um recurso do BigQuery. |
label=foo:bar |
Corresponde a recursos do BigQuery em que a chave é igual a foo e o valor da chave é igual a bar . |
label.foo=bar |
Corresponde a recursos do BigQuery em que a chave é igual a foo e o valor da chave é igual a bar . |
label.foo |
Corresponde a recursos do BigQuery que têm um rótulo cuja
chave é igual a foo como uma string. |
type=TYPE |
Corresponde a recursos de um tipo de entrada específico ou ao alias dele. |
projectid:bar |
Corresponde a recursos em projetos Google Cloud que correspondem abar como uma substring no ID. |
parent:x |
Corresponde a x como uma substring do caminho hierárquico de um recurso. O caminho principal é um fully_qualified_name do recurso principal. |
orgid=number |
Corresponde os recursos em uma organização Google Cloud ao valor exato do ID de number . |
system=SYSTEM |
Corresponde a recursos de um sistema especificado. |
location=LOCATION |
Corresponde recursos em um local especificado com um nome exato.
Por exemplo, Os recursos do BigQuery Omni oferecem suporte a esse qualificador usando o
nome do local do BigQuery Omni.
Por exemplo, |
createtime |
Encontra recursos criados em, antes ou depois de uma determinada data ou hora. Exemplo:
Formato do carimbo de data/hora: Todos os carimbos de data/hora precisam estar em GMT. Fusos horários não são aceitos. Timestamps parciais e separadores de data com hífen ( Exemplo:
|
updatetime |
Encontra recursos que foram atualizados em, antes ou depois de uma determinada data ou hora. Exemplo:
Formato do carimbo de data/hora: Todos os carimbos de data/hora precisam estar em GMT. Fusos horários não são aceitos. Timestamps parciais e separadores de data com hífen ( Exemplo:
|
fully_qualified_name:x |
Corresponde a x como uma substring de fully_qualified_name . |
fully_qualified_name=x |
Corresponde a x como fully_qualified_name . |
Pesquisa com linguagem natural
IA
As chaves de predicado type
, system
, location
e description
, e a pesquisa de aspectos (exceto has
) oferecem suporte apenas ao qualificador de correspondência exata (=
), não ao qualificador de substring (:
). Por exemplo, type=foo
.
O Dataplex Universal Catalog é compatível com os seguintes qualificadores para pesquisa em linguagem natural:
Qualificador | Descrição |
---|---|
name:x |
Corresponde a x como uma substring do ID ou do nome de exibição do recurso. |
displayname:x |
Corresponda x como substring do nome de exibição do recurso. |
column:x |
Corresponde x como uma substring do nome da coluna (ou nome da coluna aninhada) no esquema do recurso. |
description:x |
Corresponde x como um token na descrição do recurso. |
labels:bar |
Corresponde a recursos do BigQuery que têm um rótulo (com algum valor) e a chave de rótulo tem bar como substring. |
labels=bar |
Corresponde a recursos do BigQuery que têm um rótulo (com algum valor) e a chave de rótulo é igual a bar como uma string. |
labels.bar:x |
Corresponde a x como uma substring no valor de um rótulo com a chave bar anexada a um recurso do BigQuery. |
labels.foo=bar |
Corresponde a recursos do BigQuery em que a chave é igual a foo e o valor da chave é igual a bar . |
type=TYPE |
Corresponde a recursos de um tipo de entrada específico ou ao alias dele. |
projectid:bar |
Corresponde a recursos em projetos Google Cloud que correspondem abar como uma substring no ID. |
parent:x |
Corresponde a x como uma substring do caminho hierárquico de um recurso. |
system=SYSTEM |
Corresponde a recursos de um sistema especificado. |
location=LOCATION |
Corresponde recursos em um local especificado com um nome exato.
Por exemplo, Os recursos do BigQuery Omni oferecem suporte a esse qualificador usando o
nome do local do BigQuery Omni.
Por exemplo, |
createtime |
Encontra recursos criados em, antes ou depois de uma determinada data ou hora. Exemplo:
Formato do carimbo de data/hora: Todos os carimbos de data/hora precisam estar em GMT. Fusos horários não são aceitos. Timestamps parciais e separadores de data com hífen ( Exemplo:
|
updatetime |
Encontra recursos que foram atualizados em, antes ou depois de uma determinada data ou hora. Exemplo:
Formato do carimbo de data/hora: Todos os carimbos de data/hora precisam estar em GMT. Fusos horários não são aceitos. Timestamps parciais e separadores de data com hífen ( Exemplo:
|
Pesquisa de aspectos
Para pesquisar entradas com base nos aspectos anexados, use a seguinte sintaxe de consulta.
Pesquisa por palavra-chave
Qualificador | Descrição |
---|---|
aspect:x |
Corresponde a x como uma substring do caminho completo para o tipo de aspecto de um aspecto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID . |
aspect=x |
Corresponde a x como o caminho completo para o tipo de aspecto de um aspecto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID . |
aspect:xOPERATORvalue |
Pesquisa valores de campo de aspecto. Corresponde a A lista de operadores compatíveis depende do tipo de campo no aspecto, da seguinte forma:
Somente campos de nível superior do aspecto podem ser pesquisados. Por exemplo, todas as consultas a seguir correspondem a entradas em que o valor do campo
|
Pesquisa com linguagem natural
IA
Qualificador | Descrição |
---|---|
has:x |
Corresponde a x como uma substring do caminho completo para o tipo de aspecto de um aspecto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID . |
has=x |
Corresponde a x como o caminho completo para o tipo de aspecto de um aspecto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID . |
xOPERATORvalue |
Pesquisa valores de campo de aspecto. Corresponde a
Somente campos de nível superior do aspecto podem ser pesquisados. |
Operadores lógicos
Uma consulta pode consistir em vários predicados com operadores lógicos. Se você não especificar um operador, o AND
lógico ficará implícito. Por exemplo, foo bar
retorna recursos que correspondem aos predicados foo
e bar
.
Os operadores lógicos AND
e OR
são compatíveis. Por exemplo, foo OR bar
.
É possível negar um predicado com um prefixo -
(hífen) ou NOT
. Por exemplo,
-name:foo
retorna recursos com nomes que não correspondem ao predicado foo
.
Sintaxe abreviada
Uma sintaxe de pesquisa abreviada também está disponível, usando |
(barra vertical) para operadores OR
e ,
(vírgula) para operadores AND
.
Por exemplo, para procurar entradas dentro de um dos vários projetos usando o operador OR
, use a seguinte sintaxe abreviada:
projectid:(id1|id2|id3|id4)
A mesma pesquisa sem usar a sintaxe abreviada seria assim:
projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4
Para pesquisar entradas com nomes de coluna correspondentes, use o seguinte:
- AND:
column:(name1,name2,name3)
- OU:
column:(name1|name2|name3)
Essa sintaxe abreviada funciona para os predicados qualificados, exceto label
na pesquisa de palavras-chave.
A seguir
- Saiba como pesquisar recursos no Dataplex Universal Catalog
- Saiba mais sobre o gerenciamento de metadados no Dataplex Universal Catalog.
- Saiba como enriquecer entradas com metadados usando aspectos.
- Saiba como gerenciar entradas e ingerir fontes personalizadas.