이 페이지에서는 Spanner 데이터베이스에서 BigQuery 또는 Cloud Storage와 같은 지원되는 대상으로 데이터를 스트리밍하도록 변경 데이터 캡처 (CDC)를 구성하는 방법을 설명합니다.
시작하기 전에
Spanner 인스턴스가 Datastream이 실행되는 프로젝트가 아닌 다른 프로젝트에 있는 경우 Datastream 서비스 에이전트에 spanner.databaseReader IAM 역할을 제공해야 하며, Data Boost를 사용할 계획인 경우 spanner.databaseReaderWithDataBoost 역할을 제공해야 합니다. Google Cloud
세분화된 액세스 제어 데이터베이스 역할을 사용하려면 필요한 개별 권한에 관해 Spanner 연결 프로필 및 스트림 만들기를 참고하세요.
Spanner 데이터베이스 만들기
Spanner에서 변경 데이터 복제를 시작하려면 먼저 Spanner 인스턴스와 Spanner 데이터베이스를 만들어야 합니다.
변경 스트림 만들기
Spanner는 변경 내역을 사용하여 삽입, 업데이트, 삭제와 같은 데이터 변경사항을 추적하고 스트리밍합니다. Datastream에서 복제하도록 Spanner 소스를 구성하려면 Spanner 변경 내역을 만들고 구성해야 합니다. 변경 내역의 NEW_ROW 값 캡처 유형을 지정해야 합니다.
자세한 내용은 변경 내역 개요를 참고하세요.
Spanner 연결 프로필 및 스트림 만들기
새 Spanner 연결 프로필을 만들 때는 만든 Spanner 데이터베이스를 지정해야 합니다. 데이터베이스 이름은 다음 형식이어야 합니다.
projects/PROJECT_ID/instances/INSTANCE/databases/DATABASE_ID
스트림을 만들 때 다음을 선택적으로 제공할 수 있습니다.
- 포함 및 제외할 객체입니다.
- 백필 또는 변경 스트림 쿼리의 최대 동시 읽기 수입니다.
- Datastream이 Spanner를 쿼리할 때 Data Boost를 사용하도록 할지 여부입니다.
Datastream이 Spanner를 쿼리할 때 사용할 세분화된 액세스 제어 데이터베이스 역할입니다. 데이터베이스 역할에는 최소한 다음 권한이 있어야 합니다.
spanner.sessions.createspanner.sessions.deletespanner.sessions.getspanner.databases.readspanner.databases.selectspanner.databases.partitionQueryspanner.databases.partitionReadspanner.databases.beginReadOnlyTransactionspanner.databases.getDdlspanner.databases.useDataBoost(Spanner Data Boost를 사용하려는 경우)spanner.databases.useRoleBasedAccess
Datastream에서 사용할 Spanner 리모트 프로시져 콜 (RPC) 우선순위입니다.
다음 단계
- Spanner를 소스로 사용 자세히 알아보기