Insérer des données dans une table

L'insertion de données ajoute de nouveaux enregistrements et fichiers de données à votre table Apache Iceberg.

Les opérations d'écriture restent limitées au moteur spécifique (tel que Spark ou Trino) qui a créé la table à l'origine pour garantir la cohérence des métadonnées dans le catalogue d'environnements d'exécution Lakehouse.

Avant de commencer

Consultez la présentation des tables pour comprendre les différents types de tables et les implications de leur utilisation.

  1. Vérifiez que la facturation est activée pour votre Google Cloud projet.

  2. Activez l'API BigLake.

    Rôles requis pour activer les API

    Pour activer les API, vous avez besoin du rôle IAM Administrateur d'utilisation du service (roles/serviceusage.serviceUsageAdmin), qui contient l'autorisation serviceusage.services.enable. Découvrez comment attribuer des rôles.

    Activer l'API

Rôles requis

Pour obtenir les autorisations nécessaires pour insérer des données dans une table, demandez à votre administrateur de vous accorder les rôles IAM suivants sur votre projet et votre bucket de stockage :

  • Écrire des données de table en mode de distribution d'identifiants: Éditeur BigLake (roles/biglake.editor) : le projet
  • Écrire des données de table en mode de non-distribution d'identifiants :
    • Éditeur BigLake (roles/biglake.editor) : le projet
    • Utilisateur d'objets Storage (roles/storage.objectUser) : le bucket Cloud Storage

Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.

Insérer des données dans la table

Insérez des exemples de données dans la table :

Spark

spark.sql("INSERT INTO TABLE_NAME VALUES (1, \"first row\"), (2, \"second row\"), (3, \"third row\");")

Trino

INSERT INTO TABLE_NAME VALUES (1, 'first row'), (2, 'second row'), (3, 'third row');

Étape suivante