데이터 스튜디오 성능 개선

데이터 스튜디오 보고서가 로드되고 필터 적용 또는 기간 변경과 같은 보기 전용 사용자 변경사항에 응답하는 속도는 다음과 같은 여러 요인에 따라 달라집니다.

  • 기본 데이터 세트의 성능
  • 보고서의 시각화에 의해 쿼리되는 데이터의 양
  • 이러한 쿼리의 복잡성
  • 네트워크 지연 시간

이러한 요인 중 일부는 사용자 (또는 데이터 스튜디오)가 제어할 수 있는 범위를 벗어납니다. 예를 들어 기본 데이터 플랫폼의 응답성을 향상시키거나 네트워크 연결 속도를 높일 수 있는 방법이 많지 않을 수 있습니다. 하지만 데이터 스튜디오에서 보고서 성능을 세부적으로 조정할 수 있는 몇 가지 방법이 있습니다.

데이터 업데이트 속도 조정

대부분의 데이터 소스 유형에는 데이터 업데이트 빈도 옵션이 있습니다 (추출된 데이터 소스는 예외입니다). 이 옵션을 사용하면 최신 정보에 대한 요구와 보고서 실적 및 잠재적인 쿼리 비용 또는 할당량 간에 균형을 맞출 수 있습니다. 각 데이터 소스 유형에는 자체 기본 데이터 업데이트 빈도 기준이 있지만 필요에 따라 이 기준을 조정할 수 있습니다. 예를 들어 사이트 또는 앱에서 광고 실적을 측정하는 경우 일일 데이터 업데이트로 충분할 수 있습니다. 반면 소셜 미디어 분석을 기반으로 하는 보고서는 데이터 업데이트를 하루에 여러 번 진행해야 할 수 있습니다.

데이터 업데이트 빈도 관리에 대해 자세히 알아보세요.

추출된 데이터 소스 사용

추출된 데이터 소스는 최대 100MB의 데이터의 정적 스냅샷입니다. 데이터 소스가 생성되면 보고서의 데이터 요청이 기본 데이터 세트가 아닌 이 스냅샷으로 이동합니다. 추출된 데이터 소스를 사용하면 데이터에 실시간으로 연결하여 작업할 때보다 보고서와 탐색 분석이 더 빠르게 로드되고 응답 속도가 빨라집니다.

추출된 데이터 소스에는 데이터 업데이트 빈도 옵션이 없습니다. 대신 추출된 데이터 소스의 데이터를 업데이트할 시간을 예약할 수 있습니다.

데이터 추출에 대해 자세히 알아보세요.

동시 실행 및 확장 이해

데이터 스튜디오는 서버리스 아키텍처로 설계되어 데이터 스튜디오 자체는 보고서를 보는 동시 사용자 수에 엄격한 제한을 두지 않습니다. 성능과 확장성은 보고서가 연결된 기본 데이터 소스의 용량과 응답성에 따라 주로 결정됩니다.

데이터 소스 세부정보

  • BigQuery: BigQuery를 사용하는 경우 보고서 동시 실행 및 성능은 BigQuery 슬롯 가용성, 쿼리 복잡성, 데이터 크기, 캐싱과 같은 요인에 따라 달라집니다. BigQuery 슬롯 사용률 및 쿼리 성능을 모니터링합니다.

    최적화를 위해 파티셔닝, 클러스터링, BI Engine 사용과 같은 BigQuery 권장사항을 고려하세요.

  • 기타 데이터 소스: 기타 커넥터 (예: Google Sheets 또는 서드 파티 데이터베이스)의 경우 동시성 한도는 소스 시스템의 API 비율 제한, 데이터베이스 연결 풀, 전체 쿼리 처리 기능을 따릅니다.

실행 가능한 권장사항

  • 데이터 소스 쿼리 최적화: 쿼리가 최대한 효율적인지 확인합니다.
  • 캐싱 활용: 데이터 스튜디오의 데이터 최신성 설정을 활용하여 데이터를 캐시하고 소스에 대한 직접 쿼리를 줄입니다.
  • 단계적 출시: 사용자 기반이 매우 큰 경우 (예: 수천 명의 사용자) 기본 데이터 소스에 미치는 영향을 모니터링하면서 단계적 출시를 고려하세요.
  • 기본 시스템 모니터링: 데이터 소스 (예: BigQuery 슬롯 또는 API 할당량)의 성능과 할당량 사용량을 확인합니다.

BigQuery 데이터 소스 개선사항

다음 섹션에서는 BigQuery 데이터를 사용하는 보고서의 성능을 개선하는 방법을 설명합니다.

BI Engine을 사용한 BigQuery 데이터 소스 가속화

BigQuery BI Engine은 신속한 인메모리 분석 서비스입니다. BI Engine을 사용하면 1초 미만의 쿼리 응답 시간과 높은 동시 실행으로 BigQuery에 저장된 데이터를 분석할 수 있습니다.

BI Engine은 데이터 스튜디오와 통합하여 데이터 탐색 및 분석을 가속화합니다. BI Engine에서는 성능이나 확장성, 보안 또는 데이터의 최신 상태를 유지하면서 데이터 스튜디오에서 다양한 기능의 대화형 대시보드 및 보고서를 작성할 수 있습니다.

BI Engine으로 데이터 스튜디오 사용 시작하기

대규모 데이터 세트에 대한 복잡한 쿼리에 구체화된 테이블 사용

특히 대규모 데이터 세트의 경우 런타임에 복잡한 계산이나 변환을 실행하는 BigQuery 뷰에 데이터 스튜디오를 연결하면 속도가 느릴 수 있습니다. 뷰는 데이터를 재구성하는 데 유용하지만, 수백만 개의 레코드에 대해 서명된 URL을 동적으로 생성하는 것과 같은 실시간 계산을 실행하는 경우 데이터 스튜디오에서 시간 초과가 발생할 수 있습니다.

과도한 처리를 실행하는 뷰를 사용하는 대신 다음 옵션 중 하나를 사용하여 뷰의 쿼리 결과를 테이블로 구체화하세요.

그런 다음 표준 뷰 대신 구체화된 뷰 또는 테이블에 데이터 스튜디오를 연결합니다. 이렇게 하면 데이터 스튜디오의 모든 요청에 대해 복잡한 계산을 다시 실행하지 않아도 됩니다. 구체화된 데이터의 성능을 더욱 높이려면 BI Engine을 사용하세요.

BigQuery Storage Read API 사용 설정

페이지로 나누어진 결과를 사용하는 쿼리의 경우 BigQuery Storage Read API를 사용하면 쿼리 시간이 개선될 수 있습니다. 이렇게 하면 쿼리 런타임이 개선되는 경우 데이터 스튜디오에서 Storage Read API를 자동으로 사용합니다.

BigQuery Storage Read API를 사용 설정하려면 Data Studio에 연결된 BigQuery 사용자에게 다음 권한을 부여하세요.

  • bigquery.readsessions.create
  • bigquery.readsessions.getData