Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Sincronizar dados do BigQuery e do Iceberg com o AlloyDB

Nesta página, descrevemos como usar a federação do Lakehouse para o AlloyDB para PostgreSQL e sincronizar dados de tabelas nativas do BigQuery, visualizações materializadas, visualizações do BigQuery, tabelas externas do BigLake (como tabelas gerenciadas do Apache Iceberg) e tabelas externas padrão. O Iceberg é um formato de tabela aberta para gerenciar e trocar dados.

Nesta página, presumimos que você tenha um cluster e uma instância principal do AlloyDB, além de um conjunto de dados e tabelas do BigQuery. Para mais informações, consulte Criar conjuntos de dados e Criar e usar tabelas.

Antes de começar

Verifique se a flag bigquery_fdw.enabled está configurada na instância do AlloyDB.
Conheça os tipos de dados e mapeamentos de colunas do BigQuery compatíveis.

Faça login na sua conta do Google Cloud . Se você começou a usar o Google Cloud, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the AlloyDB, Compute Engine, Resource Manager, and BigQuery APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the AlloyDB, Compute Engine, Resource Manager, and BigQuery APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Ative as APIs do Cloud necessárias para criar e se conectar ao AlloyDB para PostgreSQL.

Ativar as APIs
Na etapa Confirmar projeto, clique em Próxima para confirmar o nome do projeto em que você vai fazer mudanças.
Na etapa Ativar APIs, clique em Ativar para ativar o seguinte:
- API AlloyDB
- API Compute Engine
- API Cloud Resource Manager
- API Service Networking
- API BigQuery Storage
A API Service Networking é necessária se você planeja configurar a conectividade de rede com o AlloyDB usando uma rede VPC que reside no mesmo projeto Google Cloud do AlloyDB.

As APIs Compute Engine e Cloud Resource Manager são necessárias se você planeja configurar a conectividade de rede com o AlloyDB usando uma rede VPC que reside em um projeto Google Cloud diferente.

Funções exigidas

Para conceder acesso de leitura ao conjunto de dados do BigQuery à conta de serviço do cluster do AlloyDB, você precisa das seguintes permissões:

Leitor de dados do BigQuery (roles/bigquery.dataViewer) ou qualquer papel personalizado com permissões bigquery.tables.get e bigquery.tables.getData. Quando concedida em uma tabela ou visualização, essa função fornece permissões para ler dados e metadados da tabela ou visualização.
Usuário de sessão de leitura do BigQuery (roles/bigquery.readSessionUser) ou qualquer papel personalizado com permissões bigquery.readsessions.create e bigquery.readsessions.getData. Permite criar e usar sessões de leitura.

Conceder acesso do AlloyDB ao conjunto de dados do BigQuery

Depois que o recurso de federação do Lakehouse for ativado no cluster do AlloyDB, conceda à conta de serviço do cluster acesso ao conjunto de dados do BigQuery.

Para usar a CLI gcloud, instale e inicialize a Google Cloud CLI ou use o Cloud Shell.

Abra a CLI gcloud. Se você não tiver a CLI gcloud instalada, instale e inicialize a CLI gcloud ou use o Cloud Shell.
Execute o comando gcloud beta alloydb clusters describe:
```
gcloud beta alloydb clusters describe CLUSTER --region=REGION
```
Substitua:
- CLUSTER: o ID do cluster do AlloyDB.
- REGION: o local do cluster do AlloyDB. Por exemplo, asia-east1, us-east1. Confira a lista completa de regiões em Locais do AlloyDB.
A saída contém um campo serviceAccountEmail, que é a conta de serviço deste cluster. Você também pode encontrar a conta de serviço na página Detalhes do cluster.
Conceder as permissões necessárias. Para mais informações, consulte Controlar o acesso a recursos com o IAM.

Se a conta de serviço do cluster não tiver as permissões necessárias, os seguintes erros vão aparecer quando uma consulta for executada na tabela do BigQuery:
- The user does not have bigquery.readsessions.create permissions
- Permission bigquery.tables.get denied on table
- Permission bigquery.tables.getData denied on table
Observação: se bigquery.readsessions.getData não for fornecido, resultados vazios serão retornados sem um erro.

Configurar a extensão

Crie a extensão.
1. Conecte-se à instância do AlloyDB usando o cliente psql seguindo as instruções em Conectar um cliente psql a uma instância. Ou use o AlloyDB Studio. Para mais informações, consulte Gerenciar seus dados usando o console do Google Cloud .
2. Execute este comando:
```
CREATE EXTENSION bigquery_fdw;
```
  Observação: crie essa extensão em todos os bancos de dados em que os conjuntos de dados do BigQuery precisam ser acessados.
Crie um servidor externo para definir os parâmetros de conexão do conjunto de dados remoto do BigQuery.
```
CREATE SERVER BIGQUERY_SERVER_NAME FOREIGN DATA WRAPPER bigquery_fdw;
```
Substitua:
- BIGQUERY_SERVER_NAME: identificador exclusivo do servidor externo. Defina isso uma vez em um determinado banco de dados. Você pode substituir BIGQUERY_SERVER_NAME pelo nome do seu servidor.
Crie o mapeamento de usuário executando o comando CREATE USER MAPPING, que especifica as credenciais a serem usadas ao se conectar ao servidor externo.
```
CREATE USER MAPPING FOR USERNAME SERVER BIGQUERY_SERVER_NAME ;
```
Substitua:
- USERNAME: um nome de usuário do banco de dados ou um usuário do IAM que acessa a tabela externa. Para um usuário do IAM, o nome precisa ser todo em letras minúsculas e usar aspas porque contém caracteres especiais, como @ e .).
- BIGQUERY_SERVER_NAME: identificador exclusivo do servidor externo que você criou.
Defina tabelas externas que correspondam às tabelas que você quer acessar no BigQuery usando o comando CREATE FOREIGN TABLE. Esse comando permite definir a estrutura de uma tabela remota. A tabela externa pode ter todas ou um subconjunto das colunas na tabela de origem do BigQuery.

Observação: verifique se o tipo de dados que você está usando corresponde aos tipos de dados aceitos. Para mais informações, consulte Tipos de dados e mapeamentos de colunas do BigQuery compatíveis.
```
CREATE FOREIGN TABLE TABLENAME (
  COLUMNX_NAME DATA_TYPE,
  COLUMNX_NAME DATA_TYPE,
  ...
) SERVER  BIGQUERY_SERVER_NAME 
  OPTIONS (project 'BIGQUERY_PROJECT_ID',
           dataset  'BIGQUERY_DATASET_NAME',
           table  'BIGQUERY_TABLE_NAME'
           [, mode 'EXECUTION_MODE']);
```
Substitua:
- TABLENAME: nome da tabela externa no banco de dados local.
- COLUMNX_NAME: o nome da coluna do AlloyDB. O nome da coluna precisa corresponder exatamente ao nome da coluna correspondente na tabela de origem do BigQuery. X indica que a tabela pode ser criada com várias colunas. O nome também precisa corresponder ao caso exato da coluna do BigQuery. Se o nome da coluna do BigQuery contiver letras maiúsculas, por exemplo, employeeID, o identificador do AlloyDB precisará ser colocado entre aspas duplas, por exemplo, "employeeID", para preservar letras maiúsculas ou misturadas.
- DATA_TYPE: o tipo de dados da coluna.
- BIGQUERY_SERVER_NAME: identificador exclusivo do servidor externo que você criou.
- BIGQUERY_PROJECT_ID: ID do projeto em que o conjunto de dados do BigQuery está localizado.
- BIGQUERY_DATASET_NAME: nome do conjunto de dados do BigQuery para a tabela.
- BIGQUERY_TABLE_NAME: nome da tabela do BigQuery.
- EXECUTION_MODE: opcional. A opção mode é compatível com as seguintes configurações:
  - query: use a API BigQuery para consultas complexas.
  - storage: use a API BigQuery Storage para leituras em massa mais rápidas.
  - auto: escolhe automaticamente entre os modos. Esse é o padrão.
  Para mais informações, consulte Modos de execução do invólucro de dados externos do BigQuery.
Depois que a tabela externa é criada, você pode consultá-la da mesma forma que consulta qualquer tabela no AlloyDB.