Outil : get_table_info
Obtenez des informations sur les métadonnées d'une table BigQuery.
L'exemple suivant montre comment utiliser curl pour appeler l'outil MCP get_table_info.
| Requête curl |
|---|
curl --location 'https://bigquery.googleapis.com/mcp' \ --header 'content-type: application/json' \ --header 'accept: application/json, text/event-stream' \ --data '{ "method": "tools/call", "params": { "name": "get_table_info", "arguments": { // provide these details according to the tool's MCP specification } }, "jsonrpc": "2.0", "id": 1 }' |
Schéma d'entrée
Demande de table.
| Représentation JSON |
|---|
{ "projectId": string, "datasetId": string, "tableId": string } |
| Champs | |
|---|---|
projectId |
Obligatoire. ID de projet de la demande de table. |
datasetId |
Obligatoire. ID de l'ensemble de données de la demande de table. |
tableId |
Obligatoire. ID de table de la demande de table. |
Schéma de sortie
| Représentation JSON |
|---|
{ "kind": string, "etag": string, "id": string, "selfLink": string, "tableReference": { object ( |
| Champs | |
|---|---|
kind |
Type d'ID de ressource. |
etag |
Uniquement en sortie. Hachage de cette ressource. |
id |
Uniquement en sortie. ID opaque identifiant de manière unique la table. |
selfLink |
Uniquement en sortie. URL permettant d'accéder à nouveau à cette ressource. |
tableReference |
Obligatoire. Référence décrivant l'ID de cette table. |
friendlyName |
Facultatif. Nom descriptif de cette table. |
description |
Facultatif. Description conviviale de cette table. |
labels |
Libellés associés à cette table. Vous pouvez les utiliser pour organiser et regrouper vos tableaux. Les clés et les valeurs d'étiquette ne peuvent pas dépasser 63 caractères. Elles ne peuvent contenir que des lettres minuscules, des chiffres, des traits de soulignement et des tirets. Les caractères internationaux sont acceptés. Les valeurs de libellé sont facultatives. Les clés de libellé doivent commencer par une lettre, et chaque libellé de la liste doit avoir une clé différente. Objet contenant une liste de paires |
schema |
Facultatif. Décrit le schéma de cette table. |
timePartitioning |
Si cette option est spécifiée, elle configure le partitionnement temporel pour cette table. |
rangePartitioning |
Si spécifié, configure le partitionnement par plage pour cette table. |
clustering |
Spécification de clustering pour la table. Doit être spécifié avec le partitionnement basé sur le temps. Les données de la table seront d'abord partitionnées, puis mises en cluster. |
requirePartitionFilter |
Facultatif. Si la valeur est "true", les requêtes sur cette table nécessitent la spécification d'un filtre de partition pouvant être utilisé pour éliminer les partitions. |
numBytes |
Uniquement en sortie. Taille de cette table en octets logiques, à l'exclusion des données du tampon du flux de données. |
numPhysicalBytes |
Uniquement en sortie. Taille physique de cette table en octets. Cela inclut le stockage utilisé pour le stockage temporel. |
numLongTermBytes |
Uniquement en sortie. Nombre d'octets logiques de la table considérés comme "stockage à long terme". |
numRows |
Uniquement en sortie. Nombre de lignes de données dans cette table, à l'exclusion des données du tampon du flux de données. |
creationTime |
Uniquement en sortie. Heure de création de cette table, en millisecondes depuis l'epoch. |
expirationTime |
Facultatif. Heure à laquelle cette table expire, en millisecondes depuis l'époque. Si elle n'est pas spécifiée, la table sera conservée indéfiniment. Les tables expirées seront supprimées et leur espace de stockage récupéré. La propriété defaultTableExpirationMs de l'ensemble de données d'encapsulation peut être utilisée pour définir un expirationTime par défaut sur les tables nouvellement créées. |
lastModifiedTime |
Uniquement en sortie. Heure de la dernière modification de cette table, en millisecondes depuis l'époque. |
type |
Uniquement en sortie. Décrit le type de tableau. Les valeurs suivantes sont acceptées :
La valeur par défaut est |
view |
Facultatif. Définition de la vue. |
materializedView |
Facultatif. Définition de la vue matérialisée. |
materializedViewStatus |
Uniquement en sortie. État de la vue matérialisée. |
externalDataConfiguration |
Facultatif. Décrit le format des données, l'emplacement et d'autres propriétés d'une table stockée en dehors de BigQuery. En définissant ces propriétés, la source de données peut ensuite être interrogée comme s'il s'agissait d'une table BigQuery standard. |
biglakeConfiguration |
Facultatif. Spécifie la configuration d'une table BigQuery pour Apache Iceberg. |
managedTableType |
Facultatif. S'il est défini, il remplace le type de table gérée par défaut configuré dans l'ensemble de données. |
location |
Uniquement en sortie. Emplacement géographique de la table. Cette valeur est héritée de l'ensemble de données. |
streamingBuffer |
Uniquement en sortie. Contient des informations sur le tampon de flux de données de cette table, le cas échéant. Ce champ sera absent si la table n'est pas diffusée en streaming ou s'il n'y a pas de données dans le tampon de flux. |
encryptionConfiguration |
Configuration du chiffrement personnalisée (par exemple, clés Cloud KMS). |
snapshotDefinition |
Uniquement en sortie. Contient des informations sur l'instantané. Cette valeur est définie lors de la création de l'instantané. |
defaultCollation |
Facultatif. Définit la spécification de classement par défaut des nouveaux champs STRING de la table. Lors de la création ou de la mise à jour d'une table, si un champ STRING est ajouté à cette table sans spécification de classement explicite, la table hérite du classement par défaut de la table. Si vous modifiez ce champ, seuls les champs ajoutés par la suite seront affectés. Les champs existants ne seront pas modifiés. Les valeurs suivantes sont acceptées :
|
defaultRoundingMode |
Facultatif. Définit la spécification du mode d'arrondi par défaut des nouveaux champs décimaux (NUMERIC ou BIGNUMERIC) dans le tableau. Lors de la création ou de la mise à jour d'une table, si un champ décimal y est ajouté sans mode d'arrondi explicite, il hérite du mode d'arrondi par défaut de la table. La modification de ce champ n'a aucune incidence sur les champs existants. |
cloneDefinition |
Uniquement en sortie. Contient des informations sur le clone. Cette valeur est définie lors de l'opération de clonage. |
numTimeTravelPhysicalBytes |
Uniquement en sortie. Nombre d'octets physiques utilisés par le stockage temporel (données supprimées ou modifiées). Ces données ne sont pas conservées en temps réel et peuvent être retardées de quelques secondes à quelques minutes. |
numTotalLogicalBytes |
Uniquement en sortie. Nombre total d'octets logiques dans la table ou la vue matérialisée. |
numActiveLogicalBytes |
Uniquement en sortie. Nombre d'octets logiques datant de moins de 90 jours. |
numLongTermLogicalBytes |
Uniquement en sortie. Nombre d'octets logiques datant de plus de 90 jours. |
numCurrentPhysicalBytes |
Uniquement en sortie. Nombre d'octets physiques utilisés par le stockage actuel des données en direct. Ces données ne sont pas conservées en temps réel et peuvent être retardées de quelques secondes à quelques minutes. |
numTotalPhysicalBytes |
Uniquement en sortie. Taille physique de cette table en octets. Cela inclut également le stockage utilisé pour le stockage temporel. Ces données ne sont pas conservées en temps réel et peuvent être retardées de quelques secondes à quelques minutes. |
numActivePhysicalBytes |
Uniquement en sortie. Nombre d'octets physiques datant de moins de 90 jours. Ces données ne sont pas conservées en temps réel et peuvent être retardées de quelques secondes à quelques minutes. |
numLongTermPhysicalBytes |
Uniquement en sortie. Nombre d'octets physiques datant de plus de 90 jours. Ces données ne sont pas conservées en temps réel et peuvent être retardées de quelques secondes à quelques minutes. |
numPartitions |
Uniquement en sortie. Nombre de partitions présentes dans la table ou la vue matérialisée. Ces données ne sont pas conservées en temps réel et peuvent être retardées de quelques secondes à quelques minutes. |
maxStaleness |
Facultatif. Obsolescence maximale des données pouvant être renvoyées lorsque la table (ou la vue matérialisée obsolète) est interrogée. Obsolescence encodée sous forme de chaîne encodant le type IntervalValue SQL. |
restrictions |
Facultatif. Uniquement en sortie. Configuration de la restriction pour la table. Si cette option est définie, elle limite certains accès à la table en fonction de la configuration. Pour en savoir plus, consultez Sortie des données. |
tableConstraints |
Facultatif. Informations sur les clés primaires et étrangères des tables |
resourceTags |
Facultatif. Les tags associés à cette table. Les clés de tag sont uniques. La clé de tag doit être au format avec espace de noms, par exemple "123456789012/environment", où 123456789012 correspond à l'ID de la ressource parente de l'organisation ou du projet pour cette clé de tag. La valeur du tag doit être le nom court, par exemple "Production". Pour en savoir plus, consultez Définitions des tags. Objet contenant une liste de paires |
tableReplicationInfo |
Facultatif. Informations sur la réplication de la table créée avec une instruction LDD |
replicas[] |
Facultatif. Uniquement en sortie. Références de table de tous les réplicas actuellement actifs sur la table. |
externalCatalogTableOptions |
Facultatif. Options définissant un tableau compatible Open Source. |
Champ d'union
|
|
partitionDefinition |
Facultatif. Informations sur les partitions pour tous les formats de table, y compris les tables partitionnées gérées, les tables partitionnées Hive, les tables partitionnées Iceberg et les tables partitionnées du metastore. Ce champ n'est renseigné que pour les tables partitionnées du metastore. Pour les autres formats de tableau, il s'agit d'un champ de sortie uniquement. |
| Représentation JSON |
|---|
{ "projectId": string, "datasetId": string, "tableId": string, "projectIdAlternative": [ string ], "datasetIdAlternative": [ string ], "tableIdAlternative": [ string ] } |
| Champs | |
|---|---|
projectId |
Obligatoire. ID du projet contenant cette table. |
datasetId |
Obligatoire. ID de l'ensemble de données contenant cette table. |
tableId |
Obligatoire. ID de la table. L'ID peut contenir des caractères Unicode des catégories L (lettre), M (marque), N (nombre), Pc (ponctuation de type connecteur, y compris trait de soulignement), Pd (ponctuation de type tiret) et Zs (espace). Pour en savoir plus, consultez Catégorie générale. La longueur ne doit pas dépasser 1 024 caractères. Certaines opérations permettent d'ajouter un décorateur de partition à l'ID de table, tel que |
projectIdAlternative[] |
Ce champ ne doit pas être utilisé. |
datasetIdAlternative[] |
Ce champ ne doit pas être utilisé. |
tableIdAlternative[] |
Ce champ ne doit pas être utilisé. |
| Représentation JSON |
|---|
{ "value": string } |
| Champs | |
|---|---|
value |
Valeur de la chaîne. |
| Représentation JSON |
|---|
{ "key": string, "value": string } |
| Champs | |
|---|---|
key |
|
value |
|
| Représentation JSON |
|---|
{ "fields": [ { object ( |
| Champs | |
|---|---|
fields[] |
Décrit les champs d'un tableau. |
foreignTypeInfo |
Facultatif. Spécifie les métadonnées de la définition du type de données étrangères dans le schéma de champ ( |
| Représentation JSON |
|---|
{ "name": string, "type": string, "mode": string, "fields": [ { object ( |
| Champs | |
|---|---|
name |
Obligatoire. Nom du champ. Le nom ne doit contenir que des lettres (a-z, A-Z), des chiffres (0-9) ou des traits de soulignement (_), et doit commencer par une lettre ou un trait de soulignement. La longueur ne doit pas dépasser 300 caractères. |
type |
Obligatoire. Type de données du champ. Les valeurs possibles sont les suivantes :
L'utilisation de RECORD/STRUCT indique que le champ contient un schéma imbriqué. |
mode |
Facultatif. Mode du champ. Les valeurs possibles sont NULLABLE, REQUIRED et REPEATED. La valeur par défaut est NULLABLE. |
fields[] |
Facultatif. Décrit les champs de schéma imbriqués si la propriété de type est définie sur RECORD. |
description |
Facultatif. Description du champ. La longueur ne doit pas dépasser 1 024 caractères. |
policyTags |
Facultatif. Tags avec stratégie associés à ce champ, utilisés pour le contrôle des accès au niveau des champs. Si ce champ n'est pas défini, la valeur par défaut est une liste vide de tags de règles. |
dataPolicies[] |
Facultatif. Règles de données associées à ce champ, utilisées pour le contrôle des accès au niveau des champs. |
nameAlternative[] |
Ce champ ne doit pas être utilisé. |
maxLength |
Facultatif. Longueur maximale des valeurs de ce champ pour les types STRING ou BYTES. Si max_length n'est pas spécifié, aucune contrainte de longueur maximale n'est imposée à ce champ. Si type = "STRING", max_length représente la longueur UTF-8 maximale des chaînes de ce champ. Si type = "BYTES", max_length représente le nombre maximal d'octets dans ce champ. Il n'est pas valide de définir ce champ si le type n'est pas "STRING" ni "BYTES". |
precision |
Facultatif. Contraintes de précision (nombre maximal de chiffres au total en base 10) et d'échelle (nombre maximal de chiffres dans la partie fractionnaire en base 10) pour les valeurs de ce champ pour NUMERIC ou BIGNUMERIC. Il n'est pas valide de définir la précision ou l'échelle si le type est différent de "NUMERIC" et de "BIGNUMERIC". Si la précision et l'échelle ne sont pas spécifiées, aucune contrainte de plage de valeurs n'est imposée à ce champ, dans la mesure où les valeurs sont autorisées par le type. Les valeurs de ce champ NUMERIC ou BIGNUMERIC doivent être comprises dans cette plage lorsque :
Valeurs acceptables pour la précision et l'échelle si les deux sont spécifiées :
Valeurs acceptables pour la précision si seule la précision est spécifiée, mais pas l'échelle (qui est donc interprétée comme étant égale à zéro) :
Si l'échelle est spécifiée, mais pas la précision, elle n'est pas valide. |
scale |
Facultatif. Pour en savoir plus sur la précision, consultez la documentation. |
timestampPrecision |
Facultatif. Précision (nombre maximal de chiffres au total en base 10) pour les secondes du type TIMESTAMP. Les valeurs possibles sont les suivantes : * 6 (par défaut, pour le type TIMESTAMP avec une précision de l'ordre de la microseconde) * 12 (pour le type TIMESTAMP avec une précision de l'ordre de la picoseconde) |
roundingMode |
Facultatif. Spécifie le mode d'arrondi à utiliser lors du stockage des valeurs de type NUMERIC et BIGNUMERIC. |
collation |
Facultatif. Le classement des champs ne peut être défini que lorsque le type de champ est STRING. Les valeurs suivantes sont acceptées :
|
defaultValueExpression |
Facultatif. Expression SQL permettant de spécifier la valeur par défaut de ce champ. |
rangeElementType |
Facultatif. Sous-type de la plage, si le type de ce champ est "RANGE". Ce champ est obligatoire si le type est RANGE. Les valeurs du type d'élément de champ peuvent être les suivantes :
|
foreignTypeDefinition |
Facultatif. Définition du type de données étranger. Valable uniquement pour les champs de schéma de premier niveau (pas pour les champs imbriqués). Ce champ est obligatoire si le type est défini sur "FOREIGN" (ÉTRANGER). |
| Représentation JSON |
|---|
{ "names": [ string ] } |
| Champs | |
|---|---|
names[] |
Liste des noms de ressources de tags avec stratégie. Par exemple, "projects/1/locations/eu/taxonomies/2/policyTags/3". Vous ne pouvez actuellement ajouter qu'un seul tag avec stratégie. |
| Représentation JSON |
|---|
{ // Union field |
| Champs | |
|---|---|
Champ d'union
|
|
name |
Nom de ressource de la règle de données au format projects/project_id/locations/location_id/dataPolicies/data_policy_id. |
| Représentation JSON |
|---|
{ "value": string } |
| Champs | |
|---|---|
value |
Valeur int64. |
| Représentation JSON |
|---|
{ "type": string } |
| Champs | |
|---|---|
type |
Obligatoire. Type d'un élément de champ. Pour en savoir plus, consultez |
| Représentation JSON |
|---|
{
"typeSystem": enum ( |
| Champs | |
|---|---|
typeSystem |
Obligatoire. Spécifie le système qui définit le type de données étranger. |
| Représentation JSON |
|---|
{ "type": string, "expirationMs": string, "field": string, "requirePartitionFilter": boolean } |
| Champs | |
|---|---|
type |
Obligatoire. Les types acceptés sont DAY, HOUR, MONTH et YEAR, qui génèrent respectivement une partition par jour, heure, mois et année. |
expirationMs |
Facultatif. Nombre de millisecondes pendant lesquelles conserver le stockage d'une partition. Un wrapper est utilisé ici, car 0 est une valeur non valide. |
field |
Facultatif. Si ce champ n'est pas défini, la table est partitionnée par la pseudo-colonne "_PARTITIONTIME". S'il est défini, la table est partitionnée par ce champ. Le champ doit être un champ TIMESTAMP ou DATE de premier niveau. Son mode doit être NULLABLE ou REQUIRED. Un wrapper est utilisé ici, car une chaîne vide n'est pas une valeur valide. |
requirePartitionFilter |
Si la valeur est "true", les requêtes sur cette table nécessitent la spécification d'un filtre de partition pouvant être utilisé pour éliminer les partitions. Ce champ est obsolète. Veuillez définir le champ portant le même nom directement dans la table. Ce champ a besoin d'un wrapper, car nous voulons afficher la valeur par défaut (false) si l'utilisateur l'a définie explicitement. |
| Représentation JSON |
|---|
{ "value": boolean } |
| Champs | |
|---|---|
value |
Valeur booléenne. |
| Représentation JSON |
|---|
{
"field": string,
"range": {
object ( |
| Champs | |
|---|---|
field |
Obligatoire. Nom de la colonne sur laquelle partitionner la table. Il doit s'agir d'une colonne INT64 de premier niveau dont le mode est NULLABLE ou REQUIRED. |
range |
Définit les plages pour le partitionnement de plage. |
| Représentation JSON |
|---|
{ "start": string, "end": string, "interval": string } |
| Champs | |
|---|---|
start |
Obligatoire. Valeur de début inclusive du partitionnement par plages. Ce champ est une valeur INT64 représentée sous forme de chaîne. |
end |
Obligatoire. Valeur de fin du partitionnement de la plage (exclusive). Ce champ est une valeur INT64 représentée sous forme de chaîne. |
interval |
Obligatoire. Largeur de chaque intervalle. Ce champ est une valeur INT64 représentée sous forme de chaîne. |
| Représentation JSON |
|---|
{ "fields": [ string ] } |
| Champs | |
|---|---|
fields[] |
Un ou plusieurs champs sur lesquels les données doivent être regroupées. Seuls les champs de type simple, uniques et de premier niveau sont acceptés. L'ordre des champs de clustering doit être défini du plus important au moins important à des fins de filtrage. Pour en savoir plus, consultez Présentation des tables en cluster. |
| Représentation JSON |
|---|
{
"partitionedColumn": [
{
object ( |
| Champs | |
|---|---|
partitionedColumn[] |
Facultatif. Détails sur chaque colonne de partitionnement. Ce champ est en sortie uniquement pour tous les types de partitionnement autres que les tables partitionnées du metastore. Les tables natives BigQuery ne sont compatibles qu'avec une seule colonne de partitionnement. D'autres types de tables peuvent accepter zéro, une ou plusieurs colonnes de partitionnement. Pour les tables partitionnées du metastore, l'ordre doit correspondre à l'ordre de définition dans le metastore Hive, où il doit correspondre à la disposition physique de la table. Par exemple, CREATE TABLE a_table(id BIGINT, name STRING) PARTITIONED BY (city STRING, state STRING). Dans ce cas, les valeurs doivent être ['city', 'state'] dans cet ordre. |
| Représentation JSON |
|---|
{ // Union field |
| Champs | |
|---|---|
Champ d'union
|
|
field |
Obligatoire. Nom de la colonne de partition. |
| Représentation JSON |
|---|
{ "value": string } |
| Champs | |
|---|---|
value |
Valeur uint64. |
| Représentation JSON |
|---|
{ "query": string, "userDefinedFunctionResources": [ { object ( |
| Champs | |
|---|---|
query |
Obligatoire. Requête que BigQuery exécute lorsque la vue est référencée. |
userDefinedFunctionResources[] |
Décrit les ressources de fonction définie par l'utilisateur utilisées dans la requête. |
useLegacySql |
Indique s'il faut utiliser l'ancien SQL de BigQuery pour cette vue. La valeur par défaut est "true". Si la valeur est définie sur "false", la vue utilisera le GoogleSQL de BigQuery : https://cloud.google.com/bigquery/sql-reference/. Les requêtes et les vues qui font référence à cette vue doivent utiliser la même valeur d'indicateur. Un wrapper est utilisé ici, car la valeur par défaut est "True". |
useExplicitColumnNames |
True si les noms de colonnes sont spécifiés de manière explicite. Par exemple, en utilisant la syntaxe "CREATE VIEW v(c1, c2) AS ...". Ne peut être défini que pour les vues GoogleSQL. |
privacyPolicy |
Facultatif. Spécifie les règles de confidentialité pour la vue. |
foreignDefinitions[] |
Facultatif. Représentations des vues étrangères. |
| Représentation JSON |
|---|
{ "resourceUri": string, "inlineCode": string, "inlineCodeAlternative": [ string ] } |
| Champs | |
|---|---|
resourceUri |
[Choisissez l'une des options suivantes] Une ressource de code à charger à partir d'un URI Google Cloud Storage (gs://bucket/path). |
inlineCode |
[Choisissez l'une des options suivantes] Ressource intégrée qui contient le code d'une fonction définie par l'utilisateur (UDF). Fournir une ressource de code intégré équivaut à fournir un URI pour un fichier contenant le même code. |
inlineCodeAlternative[] |
|
| Représentation JSON |
|---|
{ // Union field |
| Champs | |
|---|---|
Champ d'union privacy_policy. Règles de confidentialité associées à cette spécification d'exigences. Une seule méthode de confidentialité est autorisée par objet de source de données. privacy_policy ne peut être qu'un des éléments suivants : |
|
aggregationThresholdPolicy |
Facultatif. Règle utilisée pour les seuils d'agrégation. |
differentialPrivacyPolicy |
Facultatif. Règle utilisée pour la confidentialité différentielle. |
Champ d'union
|
|
joinRestrictionPolicy |
Facultatif. La règle de restriction à l'adhésion ne fait pas partie des règles, car elle peut être définie en même temps que d'autres règles. Cette règle permet aux fournisseurs de données d'appliquer des jointures sur les "join_allowed_columns" lorsque des données sont interrogées à partir d'une vue protégée par la confidentialité. |
| Représentation JSON |
|---|
{ "privacyUnitColumns": [ string ], // Union field |
| Champs | |
|---|---|
privacyUnitColumns[] |
Facultatif. Colonnes d'unités de confidentialité associées à cette règle. Pour le moment, une seule colonne par objet de source de données (table, vue) est autorisée en tant que colonne d'unité de confidentialité. Représentation sous forme de champ répété dans les métadonnées pour permettre l'extensibilité à plusieurs colonnes à l'avenir. Les champs de structure en double et répétés ne sont pas autorisés. Pour les champs imbriqués, utilisez la notation par points ("outer.inner"). |
Champ d'union
|
|
threshold |
Facultatif. Seuil pour la règle "Seuil d'agrégation". |
| Représentation JSON |
|---|
{ // Union field |
| Champs | |
|---|---|
Champ d'union
|
|
maxEpsilonPerQuery |
Facultatif. Valeur epsilon maximale qu'une requête peut consommer. Si l'abonné spécifie epsilon comme paramètre dans une requête SELECT, il doit être inférieur ou égal à cette valeur. Le paramètre epsilon contrôle la quantité de bruit ajoutée aux groupes. Plus la valeur epsilon est élevée, moins le bruit est important. |
Champ d'union
|
|
deltaPerQuery |
Facultatif. Valeur delta utilisée par requête. Delta représente la probabilité qu'une ligne ne soit pas différentiellement privée avec epsilon. Indique le risque associé à l'exposition des lignes agrégées dans le résultat d'une requête. |
Champ d'union
|
|
maxGroupsContributed |
Facultatif. Valeur maximale des groupes ayant contribué utilisée par requête. Représente le nombre maximal de groupes auxquels chaque entité protégée peut contribuer. Modifier cette valeur n'améliore ni ne dégrade la confidentialité. La meilleure valeur pour la précision et l'utilité dépend de la requête et des données. |
Champ d'union
|
|
privacyUnitColumn |
Facultatif. Colonne d'unités de confidentialité associée à ce règlement. Les règles de confidentialité différentielle ne peuvent comporter qu'une seule colonne d'unité de confidentialité par objet de source de données (table, vue). |
Champ d'union
|
|
epsilonBudget |
Facultatif. Budget epsilon total pour toutes les requêtes sur la vue protégée par la confidentialité. Chaque requête d'abonné sur cette vue facture le montant d'epsilon demandé dans la requête. Si le budget est suffisant, la requête d'abonné tente de se terminer. Il est possible que le paiement échoue pour d'autres raisons. Dans ce cas, le montant est remboursé. Si le budget est insuffisant, la requête est refusée. Plusieurs tentatives de débit peuvent avoir lieu si une seule requête fait référence à plusieurs vues. Dans ce cas, le budget doit être suffisant pour couvrir tous les frais. Sinon, la requête est refusée et les frais sont remboursés au mieux. Le budget n'est associé à aucune règle d'actualisation. Il ne peut être mis à jour qu'à l'aide de la commande ALTER VIEW ou contourné en créant une vue pouvant être interrogée avec un nouveau budget. |
Champ d'union
|
|
deltaBudget |
Facultatif. Budget delta total pour toutes les requêtes sur la vue protégée par la confidentialité. Chaque requête d'abonné sur cette vue facture le montant du delta prédéfini par le contributeur dans le champ delta_per_query des règles de confidentialité. Si le budget est suffisant, la requête d'abonné tente de se terminer. Il est possible que le paiement échoue pour d'autres raisons. Dans ce cas, le montant est remboursé. Si le budget est insuffisant, la requête est refusée. Plusieurs tentatives de débit peuvent avoir lieu si une seule requête fait référence à plusieurs vues. Dans ce cas, le budget doit être suffisant pour couvrir tous les frais. Sinon, la requête est refusée et les frais sont remboursés au mieux. Le budget n'est associé à aucune règle d'actualisation. Il ne peut être mis à jour qu'à l'aide de la commande ALTER VIEW ou contourné en créant une vue pouvant être interrogée avec un nouveau budget. |
Champ d'union
|
|
epsilonBudgetRemaining |
Uniquement en sortie. Budget epsilon restant. Si le budget est épuisé, aucune autre requête n'est autorisée. Notez que le budget des requêtes en cours est déduit avant leur exécution. Si la requête échoue ou est annulée, le budget est remboursé. Dans ce cas, le montant du budget restant peut augmenter. |
Champ d'union
|
|
deltaBudgetRemaining |
Uniquement en sortie. Budget delta restant. Si le budget est épuisé, aucune autre requête n'est autorisée. Notez que le budget des requêtes en cours est déduit avant leur exécution. Si la requête échoue ou est annulée, le budget est remboursé. Dans ce cas, le montant du budget restant peut augmenter. |
| Représentation JSON |
|---|
{ "joinAllowedColumns": [ string ], // Union field |
| Champs | |
|---|---|
joinAllowedColumns[] |
Facultatif. Les seules colonnes autorisées pour les jointures. Ce champ doit être spécifié pour les join_conditions JOIN_ANY et JOIN_ALL, et ne peut pas être défini pour JOIN_BLOCKED. |
Champ d'union
|
|
joinCondition |
Facultatif. Indique si une jointure est requise ou non pour les requêtes concernant la vue. La valeur par défaut est JOIN_CONDITION_UNSPECIFIED. |
| Représentation JSON |
|---|
{ "query": string, "dialect": string } |
| Champs | |
|---|---|
query |
Obligatoire. Requête qui définit la vue. |
dialect |
Facultatif. Représente le dialecte de la requête. |
| Représentation JSON |
|---|
{ "query": string, "lastRefreshTime": string, "enableRefresh": boolean, "refreshIntervalMs": string, "allowNonIncrementalDefinition": boolean } |
| Champs | |
|---|---|
query |
Obligatoire. Requête dont les résultats sont conservés. |
lastRefreshTime |
Uniquement en sortie. Date et heure de la dernière actualisation de la vue matérialisée, en millisecondes depuis l'époque. |
enableRefresh |
Facultatif. Activez l'actualisation automatique de la vue matérialisée lorsque la table de base est mise à jour. La valeur par défaut est "true". |
refreshIntervalMs |
Facultatif. Fréquence maximale d'actualisation de cette vue matérialisée. La valeur par défaut est "1800000" (30 minutes). |
allowNonIncrementalDefinition |
Facultatif. Cette option indique l'intention de créer une vue matérialisée qui n'est pas actualisée de manière incrémentielle. Les vues matérialisées non incrémentielles sont compatibles avec une gamme étendue de requêtes SQL. L'option |
| Représentation JSON |
|---|
{
"refreshWatermark": string,
"lastRefreshStatus": {
object ( |
| Champs | |
|---|---|
refreshWatermark |
Uniquement en sortie. Filigrane d'actualisation de la vue matérialisée. Les données des tables de base ont été collectées dans le cache de la vue matérialisée jusqu'à cette heure. Utilise la norme RFC 3339, où la sortie générée utilise toujours le format UTC (indiqué par "Z" pour le temps universel coordonné) avec des secondes fractionnaires de 0, 3, 6 ou 9 chiffres décimaux. Des décalages horaires autres que "Z" (UTC) sont également acceptés. Exemples : |
lastRefreshStatus |
Uniquement en sortie. Résultat d'erreur de la dernière actualisation automatique. Si ce champ est présent, indique que la dernière actualisation automatique a échoué. |
| Représentation JSON |
|---|
{ "seconds": string, "nanos": integer } |
| Champs | |
|---|---|
seconds |
Représente les secondes de l'heure UTC à partir de l'epoch Unix 1970-01-01T00:00:00Z. La valeur doit être comprise entre -62135596800 et 253402300799 inclus (ce qui correspond à 0001-01-01T00:00:00Z et 9999-12-31T23:59:59Z). |
nanos |
Fractions de secondes non négatives avec une précision de l'ordre de la nanoseconde. Ce champ correspond à la partie en nanosecondes de la durée, et non à une alternative aux secondes. Les valeurs de secondes négatives avec des fractions doivent toujours comporter des valeurs de nanosecondes non négatives comptabilisées dans le temps. La valeur doit être comprise entre 0 et 999 999 999 inclus. |
| Représentation JSON |
|---|
{ "reason": string, "location": string, "debugInfo": string, "message": string } |
| Champs | |
|---|---|
reason |
Code d'erreur court résumant l'erreur. |
location |
Spécifie l'emplacement de l'erreur, le cas échéant. |
debugInfo |
Informations de débogage. Cette propriété est interne à Google et ne doit pas être utilisée. |
message |
Description de l'erreur lisible par l'utilisateur. |
| Représentation JSON |
|---|
{ "sourceUris": [ string ], "fileSetSpecType": enum ( |
| Champs | |
|---|---|
sourceUris[] |
[Obligatoire] URI complets pointant vers vos données dans Google Cloud. Pour les URI Google Cloud Storage : chaque URI peut contenir un caractère générique "*", qui doit être placé après le nom du bucket. Les limites de taille associées aux tâches de chargement s'appliquent aux sources de données externes. Pour les URI Google Cloud Bigtable : vous ne pouvez spécifier qu'un seul URI. Il doit s'agir d'une URL HTTPS complète et valide pour une table Google Cloud Bigtable. Pour les sauvegardes Google Cloud Datastore, vous ne pouvez spécifier qu'un seul URI. De plus, le caractère générique "*" n'est pas autorisé. |
fileSetSpecType |
Facultatif. Spécifie comment les URI sources sont interprétés pour construire l'ensemble de fichiers à charger. Par défaut, les URI sources sont développés par rapport au stockage sous-jacent. Vous pouvez également spécifier des fichiers manifestes. Applicable uniquement aux systèmes de stockage d'objets. |
schema |
Facultatif. Schéma des données. Un schéma est requis pour les formats CSV et JSON si la détection automatique n'est pas activée. Le schéma n'est pas autorisé pour les formats Google Cloud Bigtable, sauvegardes Cloud Datastore, Avro, ORC et Parquet. |
sourceFormat |
[Obligatoire] Format des données. Pour les fichiers CSV, spécifiez "CSV". Pour Google Sheets, spécifiez "GOOGLE_SHEETS". Pour le format JSON délimité par un retour à la ligne, spécifiez "NEWLINE_DELIMITED_JSON". Pour les fichiers Avro, spécifiez "AVRO". Pour les sauvegardes Google Cloud Datastore, indiquez "DATASTORE_BACKUP". Pour les tables Apache Iceberg, spécifiez "ICEBERG". Pour les fichiers ORC, spécifiez "ORC". Pour les fichiers Parquet, spécifiez "PARQUET". [Bêta] Pour Google Cloud Bigtable, indiquez "BIGTABLE". |
maxBadRecords |
Facultatif. Nombre maximal d'enregistrements incorrects pouvant être ignorés par BigQuery lors de la lecture des données. Si le nombre d'enregistrements incorrects dépasse cette valeur, une erreur "non valide" est renvoyée dans le résultat de la tâche. La valeur par défaut est 0, ce qui nécessite que tous les enregistrements soient valides. Ce paramètre est ignoré pour Google Cloud Bigtable, les sauvegardes Google Cloud Datastore, ainsi que les formats Avro, ORC et Parquet. |
autodetect |
Essayez de détecter automatiquement les options de schéma et de format. Toute option spécifiée explicitement sera respectée. |
ignoreUnknownValues |
Facultatif. Indique si BigQuery doit autoriser des valeurs supplémentaires qui ne sont pas représentées dans le schéma de la table. Si le champ est défini sur true, les valeurs supplémentaires sont ignorées. Si la valeur est "false", les enregistrements comportant des colonnes supplémentaires sont traités comme des enregistrements incorrects et, si le nombre d'enregistrements incorrects est trop élevé, une erreur "non valide" est renvoyée dans le résultat de la tâche. La valeur par défaut est "false". La propriété sourceFormat détermine ce que BigQuery traite comme une valeur supplémentaire : CSV : colonnes finales JSON : valeurs nommées ne correspondant à aucun nom de colonne Google Cloud Bigtable : ce paramètre est ignoré. Sauvegardes Google Cloud Datastore : ce paramètre est ignoré. Avro : ce paramètre est ignoré. ORC : ce paramètre est ignoré. Parquet : ce paramètre est ignoré. |
compression |
Facultatif. Type de compression de la source de données. Les valeurs possibles sont "GZIP" et "NONE". La valeur par défaut est NONE. Ce paramètre est ignoré pour Google Cloud Bigtable, les sauvegardes Google Cloud Datastore, ainsi que les formats Avro, ORC et Parquet. Une chaîne vide n'est pas une valeur valide. |
csvOptions |
Facultatif. Propriétés supplémentaires à définir si sourceFormat est défini sur CSV. |
jsonOptions |
Facultatif. Propriétés supplémentaires à définir si sourceFormat est défini sur JSON. |
bigtableOptions |
Facultatif. Options supplémentaires si sourceFormat est défini sur BIGTABLE. |
googleSheetsOptions |
Facultatif. Options supplémentaires si sourceFormat est défini sur GOOGLE_SHEETS. |
maxBadRecordsAlternative[] |
Ce champ ne doit pas être utilisé. |
hivePartitioningOptions |
Facultatif. Lorsqu'il est défini, il configure la compatibilité avec le partitionnement Hive. Tous les formats de stockage ne sont pas compatibles avec le partitionnement Hive. Si vous demandez un partitionnement Hive pour un format non compatible, une erreur se produira. Il en sera de même si vous fournissez une spécification non valide. |
connectionId |
Facultatif. Connexion spécifiant les identifiants à utiliser pour lire le stockage externe, tel qu'Azure Blob, Cloud Storage ou S3. L'identifiant connection_id peut être au format |
decimalTargetTypes[] |
Définit la liste des types de données SQL possibles vers lesquels les valeurs décimales sources sont converties. Cette liste, ainsi que les paramètres de précision et d'échelle du champ décimal, déterminent le type cible. Dans l'ordre NUMERIC, BIGNUMERIC et STRING, un type est sélectionné s'il figure dans la liste spécifiée et s'il accepte la précision et l'échelle. STRING accepte toutes les valeurs de précision et d'échelle. Si aucun des types listés n'accepte la précision et l'échelle, le type acceptant la plus large plage parmi la liste spécifiée est sélectionné. Si une valeur dépasse la plage acceptée lors de la lecture des données, une erreur est renvoyée. Exemple : Supposons que la valeur de ce champ soit ["NUMERIC", "BIGNUMERIC"]. Si (précision,échelle) est :
Ce champ ne peut pas contenir de types en double. L'ordre des types dans ce champ est ignoré. Par exemple, ["BIGNUMERIC", "NUMERIC"] est identique à ["NUMERIC", "BIGNUMERIC"], et NUMERIC est toujours prioritaire par rapport à BIGNUMERIC. La valeur par défaut est ["NUMERIC", "STRING"] pour ORC et ["NUMERIC"] pour les autres formats de fichiers. |
avroOptions |
Facultatif. Propriétés supplémentaires à définir si sourceFormat est défini sur AVRO. |
jsonExtension |
Facultatif. Option de chargement à utiliser avec le format source JSON délimité par un retour à la ligne pour indiquer qu'une variante de JSON est en cours de chargement. Pour charger des données GeoJSON délimitées par un retour à la ligne, spécifiez GEOJSON (et définissez source_format sur NEWLINE_DELIMITED_JSON). |
parquetOptions |
Facultatif. Propriétés supplémentaires à définir si sourceFormat est défini sur PARQUET. |
referenceFileSchemaUri |
Facultatif. Lors de la création d'une table externe, l'utilisateur peut fournir un fichier de référence avec le schéma de la table. Cette option est activée pour les formats AVRO, PARQUET et ORC. |
metadataCacheMode |
Facultatif. Mode de cache des métadonnées pour la table. Définissez ce paramètre pour activer la mise en cache des métadonnées provenant d'une source de données externe. |
timestampTargetPrecision[] |
Précisions (nombre maximal de chiffres au total en base 10) pour les secondes des types TIMESTAMP autorisés dans la table de destination pour le mode de détection automatique. Disponible pour le format CSV. Pour le format CSV, les valeurs possibles sont les suivantes : "Not Specified" (Non spécifié), [], ou [6]: timestamp(6) pour toutes les colonnes TIMESTAMP détectées automatiquement [6, 12]: timestamp(6) pour toutes les colonnes TIMESTAMP détectées automatiquement qui comportent moins de six chiffres de sous-secondes. timestamp(12) pour toutes les colonnes TIMESTAMP détectées automatiquement et comportant plus de six chiffres de sous-secondes. [12]: timestamp(12) pour toutes les colonnes TIMESTAMP détectées automatiquement. L'ordre des éléments dans ce tableau est ignoré. Les entrées dont la précision est supérieure à la précision cible la plus élevée de ce tableau seront tronquées. |
Champ d'union
|
|
objectMetadata |
Facultatif. ObjectMetadata est utilisé pour créer des tables d'objets. Les tables d'objets contiennent une liste d'objets (avec leurs métadonnées) trouvés dans les source_uris. Si ObjectMetadata est défini, source_format doit être omis. Actuellement, SIMPLE est le seul type de métadonnées d'objet accepté. |
Champ d'union
|
|
timeZone |
Facultatif. Fuseau horaire utilisé lors de l'analyse des valeurs de code temporel qui ne comportent pas d'informations spécifiques sur le fuseau horaire (par exemple, 2024-04-20 12:34:56). Le format attendu est une chaîne de fuseau horaire IANA (par exemple, "America/Los_Angeles"). |
Champ d'union
|
|
dateFormat |
Facultatif. Format utilisé pour analyser les valeurs DATE. Accepte les valeurs de style C et SQL. |
Champ d'union
|
|
datetimeFormat |
Facultatif. Format utilisé pour analyser les valeurs DATETIME. Accepte les valeurs de style C et SQL. |
Champ d'union
|
|
timeFormat |
Facultatif. Format utilisé pour analyser les valeurs TIME. Accepte les valeurs de style C et SQL. |
Champ d'union
|
|
timestampFormat |
Facultatif. Format utilisé pour analyser les valeurs TIMESTAMP. Accepte les valeurs de style C et SQL. |
| Représentation JSON |
|---|
{ "value": integer } |
| Champs | |
|---|---|
value |
Valeur int32. |
| Représentation JSON |
|---|
{ "fieldDelimiter": string, "skipLeadingRows": string, "quote": string, "allowQuotedNewlines": boolean, "allowJaggedRows": boolean, "encoding": string, "preserveAsciiControlCharacters": boolean, "nullMarker": string, "nullMarkers": [ string ], "sourceColumnMatch": string } |
| Champs | |
|---|---|
fieldDelimiter |
Facultatif. Caractère de séparation des champs dans un fichier CSV. Le séparateur est interprété comme un octet unique. Pour les fichiers encodés en ISO-8859-1, n'importe quel caractère peut être utilisé comme séparateur. Pour les fichiers encodés en UTF-8, les caractères représentés dans la plage décimale 1-127 (U+0001-U+007F) peuvent être utilisés sans aucune modification. Pour les caractères UTF-8 encodés avec plusieurs octets (c'est-à-dire U+0080 et au-delà), seul le premier octet sera utilisé pour séparer les champs. Les octets restants seront traités comme faisant partie du champ. BigQuery est également compatible avec la séquence d'échappement "\t" (U+0009) pour spécifier la tabulation comme séparateur. La valeur par défaut est la virgule (",", U+002C). |
skipLeadingRows |
Facultatif. Nombre de lignes en haut d'un fichier CSV que BigQuery ignorera lors de la lecture des données. La valeur par défaut est 0. Cette propriété est utile si votre fichier contient des lignes d'en-tête que vous souhaitez ignorer. Lorsque la détection automatique est activée, le comportement est le suivant :
|
quote |
Facultatif. Valeur utilisée pour citer des sections de données dans un fichier CSV. BigQuery convertit la chaîne selon l'encodage ISO-8859-1, puis utilise le premier octet de la chaîne encodée pour fractionner les données dans leur état binaire brut. La valeur par défaut est un guillemet double ("). Si vos données ne contiennent pas de sections entre guillemets, définissez la valeur de la propriété sur une chaîne vide. Si vos données contiennent des caractères de retour à la ligne entre guillemets, vous devez également définir la propriété allowQuotedNewlines sur "true". Pour inclure le caractère spécifique de guillemet dans une valeur entre guillemets, faites précéder la valeur d'un guillemet supplémentaire. Par exemple, pour échapper le caractère par défaut ' " ', utilisez ' "" '. |
allowQuotedNewlines |
Facultatif. Indique si BigQuery doit autoriser les sections de données entre guillemets contenant des caractères de retour à la ligne dans un fichier CSV. La valeur par défaut est "false". |
allowJaggedRows |
Facultatif. Indique si BigQuery doit accepter les lignes pour lesquelles il manque des colonnes facultatives finales. Si la valeur est "true", BigQuery traite les colonnes de fin manquantes comme des valeurs nulles. Si la valeur est "false", les enregistrements contenant des colonnes finales manquantes sont traités comme des enregistrements incorrects et, s'il y a trop d'enregistrements incorrects, une erreur "non valide" est renvoyée dans le résultat de la tâche. La valeur par défaut est "false". |
encoding |
Facultatif. Encodage des caractères des données. Les valeurs acceptées sont UTF-8, ISO-8859-1, UTF-16BE, UTF-16LE, UTF-32BE et UTF-32LE. La valeur par défaut est UTF-8. BigQuery décode les données une fois que les données binaires brutes ont été fractionnées à l'aide des valeurs des propriétés "quote" et "fieldDelimiter". |
preserveAsciiControlCharacters |
Facultatif. Indique si les caractères de contrôle ASCII intégrés (les 32 premiers caractères de la table ASCII, de "\x00" à "\x1F") sont conservés. |
nullMarker |
Facultatif. Spécifie une chaîne représentant une valeur nulle dans un fichier CSV. Par exemple, si vous spécifiez "\N", BigQuery interprète "\N" comme une valeur nulle lors de l'interrogation d'un fichier CSV. La valeur par défaut est une chaîne vide. Si vous définissez cette propriété sur une valeur personnalisée, BigQuery génère une erreur si une chaîne vide est présente pour tous les types de données, à l'exception de STRING et BYTE. Pour les colonnes STRING et BYTE, BigQuery interprète la chaîne vide comme une valeur vide. |
nullMarkers[] |
Facultatif. Liste de chaînes représentées sous forme de valeur SQL NULL dans un fichier CSV. null_marker et null_markers ne peuvent pas être définis en même temps. Si null_marker est défini, null_markers ne doit pas l'être. Si null_markers est défini, null_marker ne doit pas l'être. Si null_marker et null_markers sont définis en même temps, une erreur utilisateur est générée. Toutes les chaînes listées dans null_markers, y compris les chaînes vides, seront interprétées comme des valeurs SQL NULL. Cela s'applique à tous les types de colonnes. |
sourceColumnMatch |
Facultatif. Contrôle la stratégie utilisée pour mettre en correspondance les colonnes chargées dans le schéma. Si elle n'est pas définie, une valeur par défaut appropriée est choisie en fonction de la façon dont le schéma est fourni. Si la détection automatique est utilisée, les colonnes sont mises en correspondance par nom. Sinon, les colonnes sont mises en correspondance par position. Cela permet de préserver la rétrocompatibilité du comportement. Les valeurs acceptées sont les suivantes : POSITION (correspondance par position). Cela suppose que les colonnes sont ordonnées de la même manière que le schéma. NAME : correspondances par nom. La ligne d'en-tête est lue comme des noms de colonnes, et les colonnes sont réorganisées pour correspondre aux noms de champs du schéma. |
| Représentation JSON |
|---|
{ "encoding": string } |
| Champs | |
|---|---|
encoding |
Facultatif. Encodage des caractères des données. Les valeurs acceptées sont UTF-8, UTF-16BE, UTF-16LE, UTF-32BE et UTF-32LE. La valeur par défaut est UTF-8. |
| Représentation JSON |
|---|
{
"columnFamilies": [
{
object ( |
| Champs | |
|---|---|
columnFamilies[] |
Facultatif. Liste des familles de colonnes à exposer dans le schéma de la table, ainsi que leurs types. Cette liste restreint les familles de colonnes pouvant être référencées dans les requêtes et spécifie leurs types de valeurs. Vous pouvez utiliser cette liste pour effectuer des conversions de types. Pour en savoir plus, consultez le champ "type". Si vous laissez cette liste vide, toutes les familles de colonnes sont présentes dans le schéma de la table et leurs valeurs sont lues sous forme d'octets. Lors d'une requête, seules les familles de colonnes référencées dans cette requête sont lues à partir de Bigtable. |
ignoreUnspecifiedColumnFamilies |
Facultatif. Si le champ est défini sur "true", les familles de colonnes qui ne sont pas spécifiées dans la liste columnFamilies ne sont pas exposées dans le schéma de la table. Dans le cas contraire, elles sont lues avec des valeurs de type BYTES. La valeur par défaut est "false". |
readRowkeyAsString |
Facultatif. Si le champ est défini sur "true", les familles de colonnes RowKey sont lues et converties sous forme de chaînes. Dans le cas contraire, elles sont lues avec des valeurs de type BYTES et les utilisateurs doivent les caster manuellement avec CAST si nécessaire. La valeur par défaut est "false". |
outputColumnFamiliesAsJson |
Facultatif. Si le champ est défini sur "true", chaque famille de colonnes sera lue comme une seule colonne JSON. Dans le cas contraire, elles sont lues comme une structure de cellule répétée contenant des tuples d'horodatage/valeur. La valeur par défaut est "false". |
| Représentation JSON |
|---|
{ "familyId": string, "type": string, "encoding": string, "columns": [ { object ( |
| Champs | |
|---|---|
familyId |
Identifiant de la famille de colonnes. |
type |
Facultatif. Type permettant de convertir la valeur dans les cellules de cette famille de colonnes. Les valeurs doivent être encodées à l'aide de la fonction HBase Bytes.toBytes lorsque vous utilisez la valeur d'encodage BINARY. Les types BigQuery suivants sont autorisés (sensibles à la casse) :
Le type par défaut est BYTES. Vous pouvez remplacer cette valeur pour une colonne spécifique en listant cette colonne dans "columns" et en spécifiant un type pour celle-ci. |
encoding |
Facultatif. Encodage des valeurs lorsque le type n'est pas STRING. Les valeurs d'encodage acceptables sont les suivantes : TEXT (indique que les valeurs sont des chaînes de texte alphanumériques). BINARY (BINAIRE) : indique que les valeurs sont encodées à l'aide de la famille de fonctions HBase Bytes.toBytes. PROTO_BINARY : indique que les valeurs sont encodées à l'aide de messages proto sérialisés. Cette option ne peut être utilisée qu'avec le type JSON. Vous pouvez remplacer cette valeur pour une colonne spécifique en listant cette colonne dans "columns" et en spécifiant un encodage pour celle-ci. |
columns[] |
Facultatif. Listes de colonnes qui doivent être exposées en tant que champs individuels plutôt qu'en tant que liste de paires (nom de colonne, valeur). Toutes les colonnes dont le qualificatif correspond à un qualificatif de cette liste sont accessibles en tant que |
onlyReadLatest |
Facultatif. Si cette option est définie, seule la dernière version de la valeur est exposée pour toutes les colonnes de cette famille de colonnes. Vous pouvez remplacer ce paramètre pour une colonne spécifique en listant cette colonne dans "columns" et en spécifiant un paramètre différent pour cette colonne. |
protoConfig |
Facultatif. Configurations spécifiques à Protobuf. Elles ne prennent effet que lorsque l'encodage est PROTO_BINARY. |
| Représentation JSON |
|---|
{
"qualifierEncoded": string,
"qualifierString": string,
"fieldName": string,
"type": string,
"encoding": string,
"onlyReadLatest": boolean,
"protoConfig": {
object ( |
| Champs | |
|---|---|
qualifierEncoded |
[Obligatoire] Qualificatif de la colonne. Les colonnes de la famille de colonnes parente qui possèdent ce qualificatif exact sont exposées en tant que champ |
qualifierString |
Chaîne de qualificatif. |
fieldName |
Facultatif. Si le qualificatif n'est pas un identifiant de champ BigQuery valide (c'est-à-dire qu'il ne correspond pas à [a-zA-Z][a-zA-Z0-9_]*), un identifiant valide doit être fourni comme nom de champ de colonne et est utilisé comme nom de champ dans les requêtes. |
type |
Facultatif. Type de données auquel convertir la valeur des cellules de cette colonne. Les valeurs doivent être encodées à l'aide de la fonction HBase Bytes.toBytes lorsque vous utilisez la valeur d'encodage BINARY. Les types BigQuery suivants sont autorisés (sensibles à la casse) :
Le type par défaut est BYTES. Le "type" peut également être défini au niveau de la famille de colonnes. Toutefois, le paramètre défini à ce niveau est prioritaire si le type est défini aux deux niveaux. |
encoding |
Facultatif. Encodage des valeurs lorsque le type n'est pas STRING. Les valeurs d'encodage acceptables sont les suivantes : TEXT (indique que les valeurs sont des chaînes de texte alphanumériques). BINARY (BINAIRE) : indique que les valeurs sont encodées à l'aide de la famille de fonctions HBase Bytes.toBytes. PROTO_BINARY : indique que les valeurs sont encodées à l'aide de messages proto sérialisés. Cette option ne peut être utilisée qu'avec le type JSON. L'encodage peut également être défini au niveau de la famille de colonnes. Toutefois, le paramètre défini à ce niveau est prioritaire si l'encodage est défini aux deux niveaux. |
onlyReadLatest |
Facultatif. Si cette option est définie, seule la dernière version de la valeur de cette colonne est exposée. "onlyReadLatest" peut également être défini au niveau de la famille de colonnes. Toutefois, le paramètre défini à ce niveau est prioritaire si "onlyReadLatest" est défini aux deux niveaux. |
protoConfig |
Facultatif. Configurations spécifiques à Protobuf. Elles ne prennent effet que lorsque l'encodage est PROTO_BINARY. |
| Représentation JSON |
|---|
{ "value": string } |
| Champs | |
|---|---|
value |
Valeur des octets. Chaîne encodée en base64. |
| Représentation JSON |
|---|
{ "schemaBundleId": string, "protoMessageName": string } |
| Champs | |
|---|---|
schemaBundleId |
Facultatif. ID de la ressource SchemaBundle Bigtable associée à ce fichier protobuf. L'ID doit être référencé dans le tableau parent, par exemple : |
protoMessageName |
Facultatif. Nom complet du message proto du fichier protobuf. Au format "foo.bar.Message". |
| Représentation JSON |
|---|
{ "skipLeadingRows": string, "range": string } |
| Champs | |
|---|---|
skipLeadingRows |
Facultatif. Nombre de lignes en haut d'une feuille que BigQuery ignorera lors de la lecture des données. La valeur par défaut est 0. Cette propriété est utile si vous avez des lignes d'en-tête à ignorer. Lorsque la détection automatique est activée, le comportement est le suivant : * skipLeadingRows non spécifié : la détection automatique tente de détecter les en-têtes de la première ligne. Si elles ne sont pas détectées, la ligne est lue en tant que données. Sinon, les données sont lues à partir de la deuxième ligne. * skipLeadingRows est défini sur 0 : indique à la détection automatique qu'il n'y a pas d'en-têtes et que les données doivent être lues à partir de la première ligne. * skipLeadingRows = N > 0 : la détection automatique ignore N-1 lignes et tente de détecter les en-têtes dans la ligne N. Si aucun en-tête n'est détecté, la ligne N est simplement ignorée. Sinon, la ligne N est utilisée pour extraire les noms de colonnes du schéma détecté. |
range |
Facultatif. Plage d'une feuille à interroger. Utilisé uniquement lorsqu'il n'est pas vide. Format type : sheet_name!top_left_cell_id:bottom_right_cell_id Par exemple : sheet1!A1:B20 |
| Représentation JSON |
|---|
{ "mode": string, "sourceUriPrefix": string, "requirePartitionFilter": boolean, "fields": [ string ] } |
| Champs | |
|---|---|
mode |
Facultatif. Lorsque cette option est définie, elle indique le mode de partitionnement Hive à utiliser lors de la lecture des données. Les modes suivants sont disponibles :
Le partitionnement Hive n'est pas compatible avec tous les formats de stockage. Si vous demandez le partitionnement Hive dans un format non compatible, une erreur se produira. Les formats actuellement acceptés sont les suivants : JSON, CSV, ORC, Avro et Parquet. |
sourceUriPrefix |
Facultatif. Lorsqu'une détection de partition Hive est demandée, un préfixe commun à tous les URI sources doit être requis. Le préfixe doit se terminer immédiatement avant le début de l'encodage de la clé de partitionnement. Prenons l'exemple de fichiers dont la configuration des données est la suivante : gs://bucket/path_to_table/dt=2019-06-01/country=USA/id=7/file.avro gs://bucket/path_to_table/dt=2019-05-31/country=CA/id=3/file.avro Lorsque le partitionnement Hive est demandé avec la détection AUTO ou CHAÎNE, le préfixe commun peut être gs://bucket/path_to_table ou gs://bucket/path_to_table/. Le mode de détection PERSONNALISÉ nécessite l'encodage du schéma de partitionnement immédiatement après le préfixe commun. Pour CUSTOM, l'une des valeurs suivantes :
seraient tous des préfixes URI sources valides. |
requirePartitionFilter |
Facultatif. Si la valeur est "true", les requêtes sur cette table nécessitent la spécification d'un filtre de partition pouvant être utilisé pour éliminer les partitions. Notez que ce champ ne doit être défini sur "true" que lors de la création d'une table externe permanente ou de l'interrogation d'une table externe temporaire. Les chargements partitionnés Hive avec require_partition_filter explicitement défini sur "true" échoueront. |
fields[] |
Uniquement en sortie. Pour les tables externes permanentes, ce champ est renseigné avec les clés de partition Hive dans l'ordre dans lequel elles ont été déduites. Les types de clés de partition peuvent être déduits en vérifiant le schéma de la table (qui inclura les clés de partition). Toutes les API ne renseignent pas ce champ dans le résultat. Par exemple, Tables.Get le renseignera, mais Tables.List ne contiendra pas ce champ. |
| Représentation JSON |
|---|
{ "useAvroLogicalTypes": boolean } |
| Champs | |
|---|---|
useAvroLogicalTypes |
Facultatif. Si sourceFormat est défini sur "AVRO", indique s'il faut interpréter les types logiques comme le type de données BigQuery correspondant (par exemple, TIMESTAMP), au lieu d'utiliser le type brut (par exemple, INTEGER). |
| Représentation JSON |
|---|
{
"enumAsString": boolean,
"enableListInference": boolean,
"mapTargetType": enum ( |
| Champs | |
|---|---|
enumAsString |
Facultatif. Indique s'il faut déduire le type logique ENUM Parquet en tant que STRING au lieu de BYTES par défaut. |
enableListInference |
Facultatif. Indique s'il faut utiliser l'inférence de schéma spécifiquement pour le type logique LIST Parquet. |
mapTargetType |
Facultatif. Indique comment représenter une carte Parquet, le cas échéant. |
| Représentation JSON |
|---|
{ "connectionId": string, "storageUri": string, "fileFormat": enum ( |
| Champs | |
|---|---|
connectionId |
Facultatif. Connexion spécifiant les identifiants à utiliser pour lire et écrire dans le stockage externe, tel que Cloud Storage. L'identifiant connection_id peut se présenter sous la forme |
storageUri |
Facultatif. Préfixe de chemin complet du dossier externe dans lequel les données de la table sont stockées. Le caractère générique "*" n'est pas autorisé. L'URI doit être au format |
fileFormat |
Facultatif. Format de fichier dans lequel les données de la table sont stockées. |
tableFormat |
Facultatif. Format de table dans lequel sont stockés les instantanés de métadonnées uniquement. |
| Représentation JSON |
|---|
{ "estimatedBytes": string, "estimatedRows": string, "oldestEntryTime": string } |
| Champs | |
|---|---|
estimatedBytes |
Uniquement en sortie. Estimation de la limite inférieure du nombre d'octets actuellement dans le tampon de flux. |
estimatedRows |
Uniquement en sortie. Estimation de la limite inférieure du nombre de lignes actuellement dans le tampon de flux. |
oldestEntryTime |
Uniquement en sortie. Contient le code temporel de l'entrée la plus ancienne dans le tampon de diffusion, en millisecondes depuis l'epoch, si le tampon de diffusion est disponible. |
| Représentation JSON |
|---|
{ "kmsKeyName": string } |
| Champs | |
|---|---|
kmsKeyName |
Facultatif. Décrit la clé de chiffrement Cloud KMS qui sera utilisée pour protéger la table BigQuery de destination. Le compte de service BigQuery associé à votre projet doit avoir accès à cette clé de chiffrement. |
| Représentation JSON |
|---|
{
"baseTableReference": {
object ( |
| Champs | |
|---|---|
baseTableReference |
Obligatoire. Référence décrivant l'ID de la table dont l'instantané a été créé. |
snapshotTime |
Obligatoire. Heure à laquelle l'instantané de la table de base a été créé. Cette valeur est indiquée dans la réponse JSON au format RFC3339. Utilise la norme RFC 3339, où la sortie générée utilise toujours le format UTC (indiqué par "Z" pour le temps universel coordonné) avec des secondes fractionnaires de 0, 3, 6 ou 9 chiffres décimaux. Des décalages horaires autres que "Z" (UTC) sont également acceptés. Exemples : |
| Représentation JSON |
|---|
{
"baseTableReference": {
object ( |
| Champs | |
|---|---|
baseTableReference |
Obligatoire. Référence décrivant l'ID de la table qui a été clonée. |
cloneTime |
Obligatoire. Heure à laquelle la table de base a été clonée. Cette valeur est indiquée dans la réponse JSON au format RFC3339. Utilise la norme RFC 3339, où la sortie générée utilise toujours le format UTC (indiqué par "Z" pour le temps universel coordonné) avec des secondes fractionnaires de 0, 3, 6 ou 9 chiffres décimaux. Des décalages horaires autres que "Z" (UTC) sont également acceptés. Exemples : |
| Représentation JSON |
|---|
{
"type": enum ( |
| Champs | |
|---|---|
type |
Uniquement en sortie. Spécifie le type de restriction de l'ensemble de données/du tableau. |
| Représentation JSON |
|---|
{ "primaryKey": { object ( |
| Champs | |
|---|---|
primaryKey |
Facultatif. Représente une contrainte de clé primaire sur les colonnes d'une table. Présent uniquement si la table comporte une clé primaire. La clé primaire n'est pas appliquée. |
foreignKeys[] |
Facultatif. Présent uniquement si la table comporte une clé étrangère. La clé étrangère n'est pas appliquée. |
| Représentation JSON |
|---|
{ "columns": [ string ] } |
| Champs | |
|---|---|
columns[] |
Obligatoire. Colonnes qui composent la contrainte de clé primaire. |
| Représentation JSON |
|---|
{ "name": string, "referencedTable": { object ( |
| Champs | |
|---|---|
name |
Facultatif. Définissez cette option uniquement si la contrainte de clé étrangère est nommée. |
referencedTable |
Obligatoire. Table contenant la clé primaire et référencée par cette clé étrangère. |
columnReferences[] |
Obligatoire. Colonnes qui composent la clé étrangère. |
| Représentation JSON |
|---|
{ "referencingColumn": string, "referencedColumn": string } |
| Champs | |
|---|---|
referencingColumn |
Obligatoire. Colonne qui compose la clé étrangère. |
referencedColumn |
Obligatoire. Colonnes de la clé primaire référencées par la colonne "referencing_column". |
| Représentation JSON |
|---|
{ "key": string, "value": string } |
| Champs | |
|---|---|
key |
|
value |
|
| Représentation JSON |
|---|
{ "sourceTable": { object ( |
| Champs | |
|---|---|
sourceTable |
Obligatoire. Référence à la table source répliquée. |
replicationIntervalMs |
Facultatif. Spécifie l'intervalle auquel la table source est interrogée pour les mises à jour. (facultatif) Si aucune valeur n'est spécifiée, l'intervalle de réplication par défaut est appliqué. |
replicatedSourceLastRefreshTime |
Facultatif. Uniquement en sortie. Si la source est une vue matérialisée, ce champ indique la dernière heure d'actualisation de la source. |
replicationStatus |
Facultatif. Uniquement en sortie. État de la réplication configurée. |
replicationError |
Facultatif. Uniquement en sortie. Erreur de réplication qui interrompra définitivement la réplication de la table. |
| Représentation JSON |
|---|
{
"parameters": {
string: string,
...
},
"storageDescriptor": {
object ( |
| Champs | |
|---|---|
parameters |
Facultatif. Carte des paires clé/valeur définissant les paramètres et les propriétés de la table Open Source. Correspond aux paramètres de table du métastore Hive. Taille maximale de 4 Mio. Objet contenant une liste de paires |
storageDescriptor |
Facultatif. Descripteur de stockage contenant des informations sur le stockage physique de cette table. |
connectionId |
Facultatif. ID de connexion qui spécifie les identifiants à utiliser pour lire le stockage externe, tel qu'Azure Blob, Cloud Storage ou Amazon S3. Cette connexion est nécessaire pour lire la table Open Source à partir de BigQuery. Le format de connection_id doit être |
| Représentation JSON |
|---|
{ "key": string, "value": string } |
| Champs | |
|---|---|
key |
|
value |
|
| Représentation JSON |
|---|
{
"locationUri": string,
"inputFormat": string,
"outputFormat": string,
"serdeInfo": {
object ( |
| Champs | |
|---|---|
locationUri |
Facultatif. Emplacement physique de la table (par exemple, |
inputFormat |
Facultatif. Spécifie le nom de classe complet de l'InputFormat (par exemple, "org.apache.hadoop.hive.ql.io.orc.OrcInputFormat"). La longueur ne doit pas dépasser 128 caractères. |
outputFormat |
Facultatif. Spécifie le nom de classe complet d'OutputFormat (par exemple, "org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat"). La longueur ne doit pas dépasser 128 caractères. |
serdeInfo |
Facultatif. Informations sur le sérialiseur et le désérialiseur. |
| Représentation JSON |
|---|
{ "name": string, "serializationLibrary": string, "parameters": { string: string, ... } } |
| Champs | |
|---|---|
name |
Facultatif. Nom du SerDe. La longueur ne doit pas dépasser 256 caractères. |
serializationLibrary |
Obligatoire. Spécifie le nom de classe complet de la bibliothèque de sérialisation chargée de la traduction des données entre la représentation tabulaire et les structures de format d'entrée et de sortie de bas niveau sous-jacentes. La longueur ne doit pas dépasser 256 caractères. |
parameters |
Facultatif. Paires clé-valeur qui définissent les paramètres d'initialisation de la bibliothèque de sérialisation. Taille maximale : 10 Kio. Objet contenant une liste de paires |
| Représentation JSON |
|---|
{ "key": string, "value": string } |
| Champs | |
|---|---|
key |
|
value |
|
Annotations d'outils
Indication de destruction : ❌ | Indication d'idempotence : ✅ | Indication de lecture seule : ✅ | Indication de monde ouvert : ❌