자연어로 Lakehouse 테이블 쿼리

이 가이드에서는 BigQuery의 대화형 분석을 사용하여 자연어 프롬프트로 Google Cloud Lakehouse 테이블의 데이터를 쿼리하는 방법을 보여줍니다.

대화형 분석 작동 방식

대화형 분석은 대규모 언어 모델 (LLM)을 사용하여 자연어 질문을 이해하고 테이블의 스키마에 매핑합니다. 이 프로세스는 다음 단계를 따릅니다.

  1. 스키마 검색: 시스템은 Lakehouse 런타임 카탈로그에서 메타데이터를 검색하여 테이블 구조, 열 이름, 데이터 유형을 파악합니다.
  2. SQL 생성: LLM은 BigQuery 엔진 및 기본 데이터 형식과 호환되는 SQL 쿼리를 생성합니다.
  3. 실행: BigQuery는 Google Cloud Lakehouse의 개방형 형식 데이터에 대해 생성된 SQL 쿼리를 직접 실행합니다.
  4. 응답: 결과는 요약 또는 시각화와 함께 대화형 인터페이스로 반환됩니다.

데이터 에이전트 관리, 가격 책정, 권장사항과 같은 대화형 분석에 대한 자세한 내용은 대화형 분석 개요를 참고하세요.

지원되는 형식

대화형 분석은 자연어 질문을 SQL 쿼리로 변환합니다. Apache Iceberg 테이블과 같이 Lakehouse 런타임 카탈로그에서 지원하는 개방형 테이블 형식을 지원합니다.

시작하기 전에

데이터를 쿼리하려면 먼저 Lakehouse 런타임 카탈로그에 외부 테이블을 등록하세요. Lakehouse 런타임 카탈로그는 BigQuery Studio를 외부 개방형 형식 데이터에 연결하는 통합 허브 역할을 합니다. 연결되면 테이블이 BigQuery 내에서 검색 가능한 애셋이 됩니다.

대화형 분석으로 테이블 쿼리

  1. 콘솔에서 BigQuery Studio 에이전트 허브로 이동합니다. Google Cloud

    에이전트 허브로 이동

  2. 데이터 에이전트 를 만들거나 기존 데이터 에이전트와 직접 대화를 시작합니다.

  3. 테이블을 선택 합니다.

    Lakehouse 런타임 카탈로그는 이러한 모든 형식을 통합하므로 검색 환경은 표준 BigQuery 테이블을 찾는 것과 동일합니다.

    1. 검색: 지식 소스를 추가할 때 테이블 검색 및 선택 인터페이스에서 테이블 이름을 조회합니다. 검색 키워드를 사용하여 다음과 같은 결과를 필터링할 수 있습니다.

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. 소스 확인: 정규화된 이름의 데이터 세트 부분을 확인합니다. 일반적으로 외부 소스에서 만들고 Lakehouse 런타임 카탈로그에서 관리하는 테이블은 카탈로그와 네임스페이스를 결합한 형식을 따릅니다. 예를 들면 PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table 또는 PROJECT_ID.sap_catalog.sales.delta_table입니다.

    3. 선택: 선택한 테이블을 활성 대화 컨텍스트에 추가합니다.

  4. 자연어로 질문합니다. 시스템은 프롬프트를 페더레이션 SQL 쿼리로 자동 변환합니다.

쿼리 정확성 개선

대화형 분석이 스키마와 용어를 더 잘 이해하도록 하려면 데이터 에이전트 구성 옵션을 사용하세요. 이러한 옵션에는 비즈니스 용어집, 확인된 SQL 쿼리, 시스템 안내가 포함됩니다.

다음 단계