Ce document décrit la syntaxe de la recherche par mots clés dans Dataplex Universal Catalog, ainsi que celle des recherches par IA en langage naturel.
Dataplex Universal Catalog vous permet de découvrir, de cataloguer de manière centralisée, de gérer et de comprendre les données de votre organisation. Pour trouver efficacement des éléments de données spécifiques dans votre catalogue de données, vous pouvez utiliser des requêtes de recherche puissantes. La syntaxe des requêtes de recherche inclut les éléments suivants :
- Recherche simple : découvrez comment trouver des composants de données à l'aide d'un seul terme de recherche.
- Prédicats qualifiés : découvrez comment affiner votre recherche à l'aide de champs de métadonnées spécifiques tels que le nom, l'emplacement ou la description.
- Recherche par aspect : découvrez comment rechercher des entrées en fonction des métadonnées métier et techniques qui leur sont associées.
- Opérateurs logiques : découvrez comment combiner plusieurs critères de recherche à l'aide des opérateurs AND et OR pour créer des requêtes complexes. En comprenant cette syntaxe, vous pouvez trouver rapidement les données dont vous avez besoin.
Avant de commencer
Comprendre les entrées, les aspects, les types d'aspects, les groupes d'entrées et les types d'entrées de Dataplex Universal Catalog. Consultez À propos de la gestion des métadonnées dans Dataplex Universal Catalog.
Dataplex Universal Catalog propose deux modes de recherche : la recherche par mots clés et la recherche en langage naturel (preview).
- La recherche par mots clés vous permet de trouver des ressources à l'aide de mots clés et de filtres spécifiques, ainsi que d'une syntaxe définie.
- La recherche en langage naturel s'appuie sur l'IA pour comprendre les requêtes sémantiques. Elle vous permet de trouver des ressources d'IA en utilisant le langage courant, sans avoir besoin d'une syntaxe complexe.
Ce document décrit la syntaxe de la recherche par mots clés et en langage naturel. IA Pour lancer une requête de recherche Dataplex Universal Catalog dans la consoleGoogle Cloud , accédez à la page Rechercher de Dataplex Universal Catalog et sélectionnez Dataplex Universal Catalog comme plate-forme de recherche.
Pour en savoir plus, consultez Rechercher des ressources dans Dataplex Universal Catalog.
Recherche en texte libre
Vous pouvez trouver des composants en saisissant un terme ou une expression sans syntaxe spécifique. Dataplex Universal Catalog effectue une recherche étendue en comparant votre requête à plusieurs champs de métadonnées, y compris les suivants :
- Nom, nom à afficher ou description d'une ressource
- Type de ressource
- ID du projet
- Description de la vue d'ensemble
- Nom de colonne (ou de colonne imbriquée) dans le schéma d'une ressource
- Description de la colonne
- Nom complet
- Contacts
- Aspects
Rechercher avec la syntaxe des requêtes
Pour des recherches plus précises, vous pouvez créer une requête à l'aide d'une syntaxe spécifique, y compris des qualificatifs, des opérateurs logiques et des recherches par aspect.
Prédicats qualifiés
Vous pouvez qualifier un prédicat en le préfixant avec une clé qui limite la correspondance à une métadonnée spécifique :
- Le signe égal (
=
) limite la recherche à une correspondance exacte. - Le signe deux-points (
:
) après la clé correspond au prédicat d'une sous-chaîne ou d'un jeton compris dans la valeur des résultats de recherche.
La tokenisation divise le flux de texte en une série de jetons, chaque jeton correspondant généralement à un seul mot.
Exemple :
name:foo
sélectionne les ressources dont le nom contient la sous-chaînefoo
, commefoo1
etbarfoo
.description:foo
sélectionne les ressources ayant le jetonfoo
dans la description, commebar
etfoo
.location=foo
établit une correspondance avec les ressources d'un emplacement spécifié dont le nom estfoo
.
Le comportement de ces qualificatifs peut varier légèrement selon les modes de recherche, comme indiqué dans les sections suivantes.
Recherche par mots clés
Les clés de prédicat type
, system
, location
et orgid
n'acceptent que le qualificatif de correspondance exacte (=
), et non celui de sous-chaîne (:
). Par exemple, type=foo
ou orgid=number
.
Dataplex Universal Catalog accepte les qualificatifs suivants pour la recherche par mots clés :
Qualificatif | Description |
---|---|
name:x |
Renvoie x en tant que sous-chaîne de l'ID de ressource. |
displayname:x |
Renvoie x en tant que sous-chaîne du nom à afficher de la ressource. |
column:x |
Correspond à x en tant que sous-chaîne du nom de colonne (ou du nom de colonne imbriquée) dans le schéma de la ressource. |
description:x |
Renvoie x en tant que jeton dans la description de la ressource. |
label:bar |
Renvoie les ressources BigQuery comportant une étiquette (avec une certaine valeur) et dont la clé d'étiquette est bar en tant que sous-chaîne. |
label=bar |
Renvoie les ressources BigQuery comportant une étiquette (avec une certaine valeur) et dont la clé d'étiquette est égale à bar en tant que chaîne. |
label:bar:x |
Renvoie x en tant que sous-chaîne dans la valeur d'une étiquette avec la clé bar associée à une ressource BigQuery. |
label=foo:bar |
Renvoie les ressources BigQuery dont la clé est égale à foo et la valeur de la clé est égale à bar . |
label.foo=bar |
Renvoie les ressources BigQuery dont la clé est égale à foo et la valeur de la clé est égale à bar . |
label.foo |
Renvoie les ressources BigQuery comportant une étiquette dont la clé est égale à foo sous forme de chaîne. |
type=TYPE |
Correspond aux ressources d'un type d'entrée spécifique ou de son alias de type. |
projectid:bar |
Renvoie les ressources dans les projets Google Cloud qui correspondent àbar en tant que sous-chaîne dans l'ID. |
parent:x |
Correspond à x en tant que sous-chaîne du chemin d'accès hiérarchique d'une ressource. Le chemin parent est un fully_qualified_name de la ressource parente. |
orgid=number |
Fait correspondre les ressources d'une organisation Google Cloud avec la valeur d'ID exacte number . |
system=SYSTEM |
Correspond aux ressources d'un système spécifié. |
location=LOCATION |
Fait correspondre les ressources d'un emplacement spécifié avec un nom exact.
Par exemple, Les composants BigQuery Omni sont compatibles avec ce qualificatif en utilisant le nom de l'emplacement BigQuery Omni.
Par exemple, |
createtime |
Recherche les ressources qui ont été créées pendant, avant ou après une date ou une heure donnée. Exemple :
Format du code temporel : Tous les horodatages doivent être à l'heure GMT (les fuseaux horaires ne sont pas acceptés). Les codes temporels partiels et les séparateurs de date (tiret Exemple :
|
updatetime |
Recherche les ressources qui ont été mises à jour pendant, avant ou après une date ou une heure donnée. Exemple :
Format du code temporel : Tous les horodatages doivent être à l'heure GMT (les fuseaux horaires ne sont pas acceptés). Les codes temporels partiels et les séparateurs de date (tiret Exemple :
|
fully_qualified_name:x |
Renvoie x en tant que sous-chaîne de fully_qualified_name . |
fully_qualified_name=x |
Correspondances x en tant que fully_qualified_name . |
Recherche en langage naturel
IA
Les clés de prédicat type
, system
, location
et description
, ainsi que la recherche par aspect (à l'exclusion de has
) n'acceptent que le qualificatif de correspondance exacte (=
), et non le qualificatif de sous-chaîne (:
). Par exemple, type=foo
.
Dataplex Universal Catalog est compatible avec les qualificatifs suivants pour la recherche en langage naturel :
Qualificatif | Description |
---|---|
name:x |
Renvoie x en tant que sous-chaîne de l'ID ou du nom à afficher de la ressource. |
displayname:x |
Renvoie x en tant que sous-chaîne du nom à afficher de la ressource. |
column:x |
Correspond à x en tant que sous-chaîne du nom de colonne (ou du nom de colonne imbriquée) dans le schéma de la ressource. |
description:x |
Renvoie x en tant que jeton dans la description de la ressource. |
labels:bar |
Renvoie les ressources BigQuery comportant une étiquette (avec une certaine valeur) et dont la clé d'étiquette est bar en tant que sous-chaîne. |
labels=bar |
Renvoie les ressources BigQuery comportant une étiquette (avec une certaine valeur) et dont la clé d'étiquette est égale à bar en tant que chaîne. |
labels.bar:x |
Renvoie x en tant que sous-chaîne dans la valeur d'une étiquette avec la clé bar associée à une ressource BigQuery. |
labels.foo=bar |
Renvoie les ressources BigQuery dont la clé est égale à foo et la valeur de la clé est égale à bar . |
type=TYPE |
Correspond aux ressources d'un type d'entrée spécifique ou de son alias de type. |
projectid:bar |
Renvoie les ressources dans les projets Google Cloud qui correspondent àbar en tant que sous-chaîne dans l'ID. |
parent:x |
Correspond à x en tant que sous-chaîne du chemin d'accès hiérarchique d'une ressource. |
system=SYSTEM |
Correspond aux ressources d'un système spécifié. |
location=LOCATION |
Fait correspondre les ressources d'un emplacement spécifié avec un nom exact.
Par exemple, Les composants BigQuery Omni sont compatibles avec ce qualificatif en utilisant le nom de l'emplacement BigQuery Omni.
Par exemple, |
createtime |
Recherche les ressources qui ont été créées pendant, avant ou après une date ou une heure donnée. Exemple :
Format du code temporel : Tous les horodatages doivent être à l'heure GMT (les fuseaux horaires ne sont pas acceptés). Les codes temporels partiels et les séparateurs de date (tiret Exemple :
|
updatetime |
Recherche les ressources qui ont été mises à jour pendant, avant ou après une date ou une heure donnée. Exemple :
Format du code temporel : Tous les horodatages doivent être à l'heure GMT (les fuseaux horaires ne sont pas acceptés). Les codes temporels partiels et les séparateurs de date (tiret Exemple :
|
Recherche d'aspects
Pour rechercher des entrées en fonction de leurs aspects associés, utilisez la syntaxe de requête suivante.
Recherche par mots clés
Qualificatif | Description |
---|---|
aspect:x |
Correspond à x en tant que sous-chaîne du chemin d'accès complet au type d'aspect d'un aspect associé à l'entrée, au format projectid.location.ASPECT_TYPE_ID |
aspect=x |
Correspond à x en tant que chemin d'accès complet au type d'aspect d'un aspect associé à l'entrée, au format projectid.location.ASPECT_TYPE_ID |
aspect:xOPERATORvalue |
Recherche des valeurs de champ d'aspect. Correspond à La liste des opérateurs acceptés dépend du type de champ dans l'aspect, comme suit :
Seuls les champs de premier niveau de l'aspect peuvent faire l'objet d'une recherche. Par exemple, toutes les requêtes suivantes correspondent aux entrées où la valeur du champ
|
Recherche en langage naturel
IA
Qualificatif | Description |
---|---|
has:x |
Correspond à x en tant que sous-chaîne du chemin d'accès complet au type d'aspect d'un aspect associé à l'entrée, au format projectid.location.ASPECT_TYPE_ID |
has=x |
Correspond à x en tant que chemin d'accès complet au type d'aspect d'un aspect associé à l'entrée, au format projectid.location.ASPECT_TYPE_ID |
xOPERATORvalue |
Recherche des valeurs de champ d'aspect. Correspond à
Seuls les champs de premier niveau de l'aspect peuvent faire l'objet d'une recherche. |
Opérateurs logiques
Une requête peut être composée de plusieurs prédicats contenant des opérateurs logiques. Si vous ne spécifiez pas d'opérateur, l'opérateur logique AND
est implicite. Par exemple, foo bar
renvoie les ressources qui correspondent à la fois au prédicat foo
et au prédicat bar
.
Les opérateurs logiques AND
et OR
sont acceptés. Par exemple, foo OR bar
.
Vous pouvez annuler un prédicat avec les préfixes -
(tiret) ou NOT
. Par exemple, -name:foo
renvoie les ressources dont le nom ne correspond pas au prédicat foo
.
Syntaxe abrégée
Une syntaxe de recherche abrégée est également disponible, en utilisant |
(barre verticale) pour les opérateurs OR
et ,
(virgule) pour les opérateurs AND
.
Par exemple, pour rechercher des entrées dans l'un des nombreux projets à l'aide de l'opérateur OR
, vous pouvez utiliser la syntaxe abrégée suivante :
projectid:(id1|id2|id3|id4)
La même recherche sans utiliser la syntaxe abrégée se présente comme suit :
projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4
Pour rechercher des entrées avec des noms de colonne correspondants, utilisez la méthode suivante :
- ET :
column:(name1,name2,name3)
- OU :
column:(name1|name2|name3)
Cette syntaxe abrégée fonctionne pour les prédicats qualifiés, à l'exception de label
dans la recherche par mot clé.
Étapes suivantes
- Découvrez comment rechercher des ressources dans Dataplex Universal Catalog.
- Renseignez-vous sur la gestion des métadonnées dans Dataplex Universal Catalog.
- Découvrez comment enrichir des entrées avec des métadonnées à l'aide des aspects.
- Apprenez à gérer les entrées et ingérer des sources personnalisées.