Lakehouse pour Apache Iceberg permet de créer, de gérer et d'interroger des tables de catalogue REST Lakehouse Iceberg stockées dans Cloud Storage.
Gérées par le catalogue d'environnements d'exécution Lakehouse, ces tables peuvent être lues par BigQuery et les moteurs Open Source connectés. Les opérations d'écriture restent limitées au moteur spécifique qui a créé la table à l'origine. En plus des intégrations du moteur de requête, le catalogue d'environnements d'exécution Lakehouse implémente la spécification de l'API Iceberg REST Catalog Open Source, ce qui permet aux clients REST compatibles d'interagir directement avec les ressources de table.
Avant de commencer
Consultez l'aperçu des tableaux pour comprendre les différents types de tableaux et les implications de leur utilisation.
-
Vérifiez que la facturation est activée pour votre projet Google Cloud .
-
Activez l'API BigLake.
Rôles requis pour activer les API
Pour activer les API, vous avez besoin du rôle IAM Administrateur Service Usage (
roles/serviceusage.serviceUsageAdmin), qui contient l'autorisationserviceusage.services.enable. Découvrez comment attribuer des rôles.
Rôles requis
Pour obtenir les autorisations nécessaires pour gérer les tables du catalogue REST Iceberg Lakehouse, demandez à votre administrateur de vous accorder les rôles IAM suivants sur votre projet et votre bucket de stockage :
-
Créer et supprimer des tableaux :
- Administrateur BigLake (
roles/biglake.admin) : le projet - Administrateur de l'espace de stockage (
roles/storage.admin) : le bucket Cloud Storage
- Administrateur BigLake (
-
Lire les données de table en mode de distribution d'identifiants : Lecteur BigLake (
roles/biglake.viewer) – le projet -
Écrire des données de table en mode de distribution d'identifiants : Éditeur BigLake (
roles/biglake.editor) – le projet -
Lisez les données de table en mode sans distribution d'identifiants :
- Lecteur BigLake (
roles/biglake.viewer) : projet - Lecteur des objets Storage (
roles/storage.objectViewer) : le bucket Cloud Storage
- Lecteur BigLake (
-
Écrivez les données de la table en mode de distribution d'identifiants non activé :
- Éditeur BigLake (
roles/biglake.editor) : projet - Utilisateur d'objets Storage (
roles/storage.objectUser) : le bucket Cloud Storage
- Éditeur BigLake (
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.
Actions de gestion
Vous pouvez effectuer les actions de gestion suivantes sur vos tables de catalogue REST Iceberg Lakehouse :
- Créer une table : créez une table Apache Iceberg dans un espace de noms de catalogue à l'aide de la console Google Cloud , de Spark, de Trino ou de l'API Iceberg REST Catalog (
CreateIcebergTable). - Lister les tables : affichez les identifiants de table dans un espace de noms à l'aide de la console Google Cloud , de Spark, de Trino ou de l'API Iceberg REST Catalog (
ListIcebergTableIdentifiers). - Obtenir les détails d'une table : inspectez le schéma, les propriétés et les identifiants d'une table à l'aide de la console Google Cloud , de Spark, de Trino ou de l'API Iceberg REST Catalog (
GetIcebergTable,LoadIcebergTableCredentials). - Insérer des données : ajoutez des lignes de données à vos tables Iceberg à l'aide de Spark ou Trino.
- Interroger une table : exécutez des requêtes sur vos tables Iceberg depuis Spark, Trino ou BigQuery à l'aide de noms de tables en quatre parties.
- Modifier une table : faites évoluer le schéma de table et mettez à jour les propriétés des métadonnées à l'aide de la console Google Cloud , de Spark, de Trino ou de l'API Iceberg REST Catalog (
UpdateIcebergTable). - Supprimer une table : supprimez l'enregistrement d'une table du catalogue sans supprimer les fichiers de stockage sous-jacents à l'aide de la console Google Cloud , de Spark, de Trino ou de l'API Iceberg REST Catalog (
DeleteIcebergTable).
Étapes suivantes
- Consultez le catalogue REST Apache Iceberg.