Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

소스 Spanner 데이터베이스 구성

이 페이지에서는 Spanner 데이터베이스에서 BigQuery 또는 Cloud Storage와 같은 지원되는 대상으로 데이터를 스트리밍하도록 변경 데이터 캡처 (CDC)를 구성하는 방법을 설명합니다.

시작하기 전에

Spanner 인스턴스가 Datastream이 실행되는 프로젝트가 아닌 다른 프로젝트에 있는 경우 Datastream 서비스 에이전트에 spanner.databaseReader IAM 역할을 제공해야 하며, Data Boost를 사용할 계획인 경우 spanner.databaseReaderWithDataBoost 역할을 제공해야 합니다. Google Cloud

세분화된 액세스 제어 데이터베이스 역할을 사용하려면 필요한 개별 권한에 관해 Spanner 연결 프로필 및 스트림 만들기를 참고하세요.

Spanner 데이터베이스 만들기

Spanner에서 변경 데이터 복제를 시작하려면 먼저 Spanner 인스턴스와 Spanner 데이터베이스를 만들어야 합니다.

변경 스트림 만들기

Spanner는 변경 내역을 사용하여 삽입, 업데이트, 삭제와 같은 데이터 변경사항을 추적하고 스트리밍합니다. Datastream에서 복제하도록 Spanner 소스를 구성하려면 Spanner 변경 내역을 만들고 구성해야 합니다. 변경 내역의 NEW_ROW 값 캡처 유형을 지정해야 합니다.

자세한 내용은 변경 내역 개요를 참고하세요.

Spanner 연결 프로필 및 스트림 만들기

새 Spanner 연결 프로필을 만들 때는 만든 Spanner 데이터베이스를 지정해야 합니다. 데이터베이스 이름은 다음 형식이어야 합니다.

projects/PROJECT_ID/instances/INSTANCE/databases/DATABASE_ID

스트림을 만들 때 다음을 선택적으로 제공할 수 있습니다.

포함 및 제외할 객체입니다.
백필 또는 변경 스트림 쿼리의 최대 동시 읽기 수입니다.

변경 스트림 쿼리의 최대 동시 읽기 수(CDC 동시 실행 제한)를 설정하면 스트리밍 지연 시간이 늘어날 수 있습니다. 변경 내역이 파티션으로 나누어져 있고 동시성을 제한하면 Datastream이 여러 파티션을 동시에 읽지 못하기 때문입니다. CPU 사용량이 많은 경우에만 이 값을 설정하는 것이 좋습니다.
Datastream이 Spanner를 쿼리할 때 Data Boost를 사용하도록 할지 여부입니다.
Datastream이 Spanner를 쿼리할 때 사용할 세분화된 액세스 제어 데이터베이스 역할입니다. 이 역할을 사용하려면 Datastream에 최소한 다음 IAM 권한이 필요합니다.
- spanner.databases.useRoleBasedAccess
- spanner.databaseRoles.list
- spanner.databases.useDataBoost (Spanner Data Boost를 사용하려는 경우)
또한 Spanner 데이터베이스 역할에 다음 권한이 있어야 합니다.
- 스트리밍되는 테이블에 대한 SELECT 권한
- 변경 내역에 대한 세분화된 권한입니다. 자세한 내용은 변경 내역에 대해 세분화된 액세스 제어를 참고하세요.
Datastream에서 사용할 Spanner 리모트 프로시져 콜 (RPC) 우선순위입니다.

다음 단계

Spanner를 소스로 사용 자세히 알아보기