Looker에서 대화형 분석을 구성하기 위한 권장사항

대화형 분석을 사용하면 사용자가 Looker 인스턴스 내에서 자연어로 질문하여 LookML로 모델링된 데이터를 쿼리할 수 있습니다. 사용자는 다음과 같은 방법으로 데이터를 쿼리할 수 있습니다.

이 가이드에서는 LookML 개발자가 대화형 분석을 성공적으로 구성하고 최적화하는 데 도움이 되는 전략과 권장사항을 제공합니다. 이 가이드에는 다음 주제가 포함되어 있습니다.

LookML 모델과 대화형 분석을 준비하면 사용자 채택을 늘리고 사용자가 질문에 대한 정확하고 유용한 답변을 얻을 수 있습니다.

Google Cloud 를 위한 Gemini에서 사용자 데이터를 사용하는 방법과 시점을 알아보세요.

대화형 분석을 위한 LookML 권장사항

대화형 분석은 두 가지 기본 입력을 활용하여 자연어 질문을 해석합니다.

  1. LookML 모델: 대화형 분석은 Looker Explore의 기반이 되는 LookML 모델에 정의된 구조, 필드 (측정기준, 측정값), 라벨, 설명, 동의어를 분석합니다.

  2. 고유한 필드 값: 대화형 분석은 필드 내의 데이터 값 (특히 문자열 측정기준 및 동의어)을 검사하여 사용자가 질문할 수 있는 사용 가능한 카테고리와 항목을 식별합니다. 카디널리티 (고유한 값의 수)는 이러한 값이 사용되는 방식에 영향을 줄 수 있습니다.

대화형 분석의 효과는 이러한 두 입력의 품질과 명확성과 직접적으로 관련이 있습니다. 다음 표에는 명확하지 않거나 모호한 LookML이 대화형 분석에 부정적인 영향을 미칠 수 있는 일반적인 방법과 출력 및 사용자 경험을 개선하기 위한 해결 방법이 나와 있습니다.

일반적인 LookML 품질 문제 더 명확한 대화형 분석을 위한 솔루션
명확성 부족: 명확한 라벨이나 설명이 없는 필드는 대화형 분석과 사용자 모두에게 모호합니다. 명확한 라벨 적용: label 매개변수를 사용하여 사용자가 질문에 사용할 가능성이 높은 직관적이고 비즈니스 친화적인 필드 이름을 지정합니다.
필드 과부하: 너무 많은 필드, 특히 내부 ID (기본 키), 조인에서 상속된 중복 필드 또는 중간 계산 필드를 노출하면 대화형 분석에 사용할 수 있는 옵션이 어수선해질 수 있습니다. 관련 없는 필드 숨기기: 모든 기본 키, 외래 키, 조인에서 중복된 필드, 순전히 기술적인 필드가 숨겨진 상태로 유지되는지 확인합니다.

(선택사항) 탐색 분석 확장: 탐색 분석에 필드가 많이 포함되어 있는 경우 기존 탐색 분석을 확장하는 새 탐색 분석을 만드는 것이 좋습니다. 이렇게 하면 다른 콘텐츠가 사용할 수 있는 탐색 분석을 수정하지 않고도 인기 콘텐츠의 전용 버전을 대화형 분석에 맞게 조정할 수 있습니다.
이름 충돌: Explore 내의 여러 뷰에서 이름이나 라벨이 유사하거나 동일한 필드가 여러 개 있으면 필드가 잘못 선택될 수 있습니다. 자세한 설명 작성: 설명은 Conversational Analytics에 중요한 컨텍스트를 제공합니다. 다음 작업에는 description 매개변수를 사용합니다.
  • 자연어를 사용하여 필드를 명확하게 설명합니다.
  • 회사 또는 업계별 용어 또는 동의어를 포함합니다.
  • 계산 또는 맥락을 설명합니다. 대화형 분석은 설명을 사용하여 필드 의미를 더 잘 식별하고 사용자 용어를 매핑합니다.

예를 들어 라벨이 user_count인 필드의 설명은 '웹사이트를 방문한 총 순 사용자 수'일 수 있습니다.

이름 표준화: 필드 이름과 라벨의 일관성과 명확성을 검토합니다.
숨겨진 복잡성: 대시보드 수준의 맞춤 필드 또는 표 계산에 크게 의존하면 잠재적으로 중요한 비즈니스 로직에 대화형 분석이 액세스할 수 없습니다. 맞춤 로직 통합: 중요하고 일반적으로 사용되는 맞춤 필드 또는 테이블 계산을 식별합니다. 대화형 분석에서 사용할 수 있도록 이러한 필드의 로직을 LookML 측정기준 및 측정값으로 변환합니다.
정리되지 않은 데이터: 다음과 같은 일관되지 않거나 구조화되지 않은 데이터 유형은 대화형 분석에서 쿼리를 정확하게 해석하기 어렵게 만듭니다.
  • 값 변형: 대소문자 또는 명명 규칙이 일관되지 않으면 (예: complete, Complete, COMPLETE 값이 혼합됨) 대화형 분석에서 데이터가 중복되거나 데이터 관계가 잘못될 수 있습니다.
  • 일관되지 않은 데이터 유형: 숫자여야 하지만 가끔 문자열 값을 포함하는 열로 인해 필드 유형이 string로 강제 설정되어 숫자 연산을 할 수 없습니다.
  • 시간대 모호성: 타임스탬프 필드에 표준화된 시간대가 없으면 필터링이나 집계가 잘못될 수 있습니다.
데이터 품질 문제 해결: 가능한 경우 데이터 선별 중에 식별한 데이터 품질 문제 (일관성 없는 값, 유형, 시간대)를 표시합니다. 데이터 엔지니어링팀과 협력하여 소스 데이터를 정리하거나 ETL/데이터 모델링 레이어에서 변환을 적용합니다.

명확하고 효율적인 LookML 작성에 관한 권장사항은 다음 문서를 참고하세요.

LookML과 대화형 분석에 컨텍스트를 추가해야 하는 경우

대화형 분석에서는 LookML과 에이전트 지침 내부에 필드 동의어 및 설명과 같은 컨텍스트 입력을 추가할 수 있습니다. 컨텍스트를 추가할 위치를 결정할 때는 다음 안내를 따르세요. 항상 참인 컨텍스트는 LookML 모델에 직접 추가해야 합니다. Looker Explore는 대시보드와 대화형 분석을 비롯한 여러 위치에서 사용될 수 있으므로 LookML에 적용된 컨텍스트는 데이터와 상호작용할 수 있는 모든 사용자에게 적용되어야 합니다.

상담사 컨텍스트는 정성적이고 사용자에게 초점을 맞춰야 하며, 하나의 Explore에서 여러 사용자를 지원하는 상담사가 있을 수 있습니다. 에이전트 안내에는 포함되어야 하지만 LookML에는 포함되지 않아야 하는 컨텍스트의 예는 다음과 같습니다.

  • 에이전트와 상호작용하는 사용자는 누구인가요? 이들의 역할은 무엇인가요? 회사 내부 직원인가요, 아니면 외부 직원인가요? 이전 분석 경험은 무엇인가요?
  • 사용자의 목표는 무엇인가요? 대화가 끝날 때 어떤 유형의 결정을 내리고 싶어 하나요?
  • 이 사용자는 어떤 유형의 질문을 할까요?
  • 이 사용자에게만 해당하는 상위 필드는 무엇인가요? 이 사용자가 사용할 필요가 없는 필드는 무엇인가요?

대화형 분석과 함께 사용할 탐색 분석 설정 권장사항

대화형 분석에서 가장 유용한 답변을 제공할 수 있도록 대화형 분석의 데이터 소스로 사용할 탐색 분석을 정의할 때 다음 권장사항을 따르세요.

  • Explore의 기본 LookML에서 최종 사용자의 분석에 유용한 필드만 정의합니다.
  • 각 필드에 명확하고 간결한 이름을 지정합니다.
  • 각 필드에 명확한 설명을 제공하고 관련이 있는 경우 샘플 값을 포함합니다. 이러한 필드 설명은 대화형 분석으로 전송되는 프롬프트에 포함되며 컨텍스트를 제공하는 데 유용할 수 있습니다. 샘플 값은 특히 문자열 필드에 유용합니다.