Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Synchroniser les données BigQuery et Iceberg avec AlloyDB

Cette page explique comment utiliser la fédération Lakehouse pour AlloyDB pour PostgreSQL afin de synchroniser les données des tables natives BigQuery, des vues matérialisées, des vues BigQuery, des tables externes BigLake (telles que les tables gérées Apache Iceberg) et des tables externes standards. Iceberg est un format de table ouvert permettant de gérer et d'échanger des données.

Cette page suppose que vous disposez d'un cluster et d'une instance principale AlloyDB, ainsi que d'un ensemble de données et de tables BigQuery. Pour en savoir plus, consultez Créer des ensembles de données et Créer et utiliser des tables.

Avant de commencer

Assurez-vous que le flag bigquery_fdw.enabled est configuré sur l'instance AlloyDB.
Familiarisez-vous avec les types de données BigQuery et les mappages de colonnes compatibles.

Connectez-vous à votre compte Google Cloud . Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits sans frais pour exécuter, tester et déployer des charges de travail.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the AlloyDB, Compute Engine, Resource Manager, and BigQuery APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the AlloyDB, Compute Engine, Resource Manager, and BigQuery APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Activez les API Cloud nécessaires pour créer une instance AlloyDB pour PostgreSQL et vous y connecter.

Activer les API
À l'étape Confirmer le projet, cliquez sur Suivant pour confirmer le nom du projet que vous allez modifier.
À l'étape Activer les API, cliquez sur Activer pour activer les éléments suivants :
- API AlloyDB
- API Compute Engine
- API Cloud Resource Manager
- API Service Networking
- API BigQuery Storage
L'API Service Networking est requise si vous prévoyez de configurer la connectivité réseau à AlloyDB à l'aide d'un réseau VPC qui réside dans le même projet Google Cloud qu'AlloyDB.

Les API Compute Engine et Cloud Resource Manager sont requises si vous prévoyez de configurer la connectivité réseau à AlloyDB à l'aide d'un réseau VPC résidant dans un autre projet Google Cloud .

Rôles requis

Pour accorder l'accès en lecture à l'ensemble de données BigQuery au compte de service du cluster AlloyDB, vous devez disposer des autorisations suivantes :

Lecteur de données BigQuery (roles/bigquery.dataViewer) ou tout rôle personnalisé disposant des autorisations bigquery.tables.get et bigquery.tables.getData. Lorsqu'il est attribué à une table ou une vue, ce rôle permet de lire les données et les métadonnées de la table ou de la vue.
Utilisateur de sessions de lecture BigQuery (roles/bigquery.readSessionUser) ou tout rôle personnalisé disposant des autorisations bigquery.readsessions.create et bigquery.readsessions.getData. Permet de créer et d'utiliser des sessions de lecture.

Accorder à AlloyDB l'accès à l'ensemble de données BigQuery

Une fois la fonctionnalité de fédération Lakehouse activée sur votre cluster AlloyDB, accordez au compte de service du cluster AlloyDB l'accès à l'ensemble de données BigQuery.

Pour utiliser la gcloud CLI, vous pouvez installer et initialiser la Google Cloud CLI, ou utiliser Cloud Shell.

Ouvrez gcloud CLI. Si gcloud CLI n'est pas installé, installez-le et initialisez-le, ou utilisez Cloud Shell.
Exécutez la commande gcloud beta alloydb clusters describe :
```
gcloud beta alloydb clusters describe CLUSTER --region=REGION
```
Remplacez les éléments suivants :
- CLUSTER : ID du cluster AlloyDB.
- REGION : emplacement du cluster AlloyDB (par exemple, asia-east1, us-east1). Consultez la liste complète des régions sur la page Emplacements AlloyDB.
Le résultat contient un champ serviceAccountEmail, qui correspond au compte de service de ce cluster. Vous pouvez également trouver le compte de service sur la page Détails du cluster.
Accordez les autorisations requises. Pour en savoir plus, consultez Contrôler l'accès aux ressources avec IAM.

Si le compte de service du cluster ne dispose pas des autorisations requises, les erreurs suivantes s'affichent lorsqu'une requête est exécutée sur la table BigQuery :
- The user does not have bigquery.readsessions.create permissions
- Permission bigquery.tables.get denied on table
- Permission bigquery.tables.getData denied on table
Remarque : Si bigquery.readsessions.getData n'est pas fourni, des résultats vides sont renvoyés sans erreur.

Configurer l'extension

Créez l'extension.
1. Connectez-vous à l'instance AlloyDB à l'aide du client psql en suivant les instructions de la section Connecter un client psql à une instance. Vous pouvez également utiliser AlloyDB Studio. Pour en savoir plus, consultez Gérer vos données à l'aide de la console Google Cloud .
2. Exécutez la commande suivante :
```
CREATE EXTENSION bigquery_fdw;
```
  Remarque : Vous devez créer cette extension dans toutes les bases de données où les ensembles de données BigQuery doivent être accessibles.
Créez un serveur étranger pour définir les paramètres de connexion à l'ensemble de données BigQuery distant.
```
CREATE SERVER BIGQUERY_SERVER_NAME FOREIGN DATA WRAPPER bigquery_fdw;
```
Remplacez les éléments suivants :
- BIGQUERY_SERVER_NAME : identifiant unique du serveur étranger. Définissez-le une seule fois dans une base de données donnée. Vous pouvez remplacer BIGQUERY_SERVER_NAME par le nom de votre serveur.
Créez le mappage d'utilisateur en exécutant la commande CREATE USER MAPPING, qui spécifie les identifiants à utiliser lorsque vous vous connectez au serveur étranger.
```
CREATE USER MAPPING FOR USERNAME SERVER BIGQUERY_SERVER_NAME ;
```
Remplacez les éléments suivants :
- USERNAME : nom d'utilisateur de base de données ou utilisateur IAM qui accède à la table externe. Pour un utilisateur IAM, le nom doit être en minuscules et utiliser des guillemets, car il contient des caractères spéciaux tels que @ et .).
- BIGQUERY_SERVER_NAME : identifiant unique du serveur étranger que vous avez créé.
Définissez les tables externes qui correspondent aux tables auxquelles vous souhaitez accéder dans BigQuery à l'aide de la commande CREATE FOREIGN TABLE. Cette commande vous permet de définir la structure d'une table distante. La table externe peut contenir toutes les colonnes de la table source dans BigQuery ou seulement un sous-ensemble.

Remarque : Assurez-vous que le type de données que vous utilisez correspond aux types de données compatibles. Pour en savoir plus, consultez Types de données BigQuery et mappages de colonnes compatibles.
```
CREATE FOREIGN TABLE TABLENAME (
  COLUMNX_NAME DATA_TYPE,
  COLUMNX_NAME DATA_TYPE,
  ...
) SERVER  BIGQUERY_SERVER_NAME 
  OPTIONS (project 'BIGQUERY_PROJECT_ID',
           dataset  'BIGQUERY_DATASET_NAME',
           table  'BIGQUERY_TABLE_NAME'
           [, mode 'EXECUTION_MODE']);
```
Remplacez les éléments suivants :
- TABLENAME : nom de la table étrangère dans la base de données locale.
- COLUMNX_NAME : nom de la colonne AlloyDB. Le nom de la colonne doit correspondre exactement à celui de la colonne correspondante dans la table source BigQuery. X indique que le tableau peut être créé avec plusieurs colonnes. Le nom doit également correspondre exactement à la casse de la colonne BigQuery. Si le nom de la colonne BigQuery contient des majuscules (par exemple, employeeID), l'identifiant AlloyDB doit être placé entre guillemets doubles (par exemple, "employeeID") pour conserver les lettres en majuscules ou en minuscules.
- DATA_TYPE : type de données de la colonne
- BIGQUERY_SERVER_NAME : identifiant unique du serveur étranger que vous avez créé.
- BIGQUERY_PROJECT_ID : ID du projet dans lequel réside l'ensemble de données BigQuery.
- BIGQUERY_DATASET_NAME : nom de l'ensemble de données BigQuery pour la table.
- BIGQUERY_TABLE_NAME : nom de la table BigQuery.
- EXECUTION_MODE : facultatif. L'option mode accepte les paramètres suivants :
  - query : utilisez l'API BigQuery pour les requêtes complexes.
  - storage : utilisez l'API BigQuery Storage pour des lectures groupées plus rapides.
  - auto : choisit automatiquement entre les modes. Il s'agit de l'option par défaut.
  Pour en savoir plus, consultez Modes d'exécution du wrapper de données externes BigQuery.
Une fois la table externe créée, vous pouvez l'interroger de la même manière que n'importe quelle table dans AlloyDB.