자연어로 BigLake 데이터 쿼리

이 가이드에서는 BigQuery의 대화형 분석을 사용하여 자연어 프롬프트로 BigLake 테이블의 데이터를 쿼리하는 방법을 보여줍니다.Google CloudBigLake를 활용하면 BigLake의 자체 데이터를 표준 BigQuery 테이블처럼 상호작용할 수 있습니다.

대화 분석 작동 방식

대화형 분석은 대규모 언어 모델 (LLM)을 사용하여 자연어 질문을 이해하고 BigLake 테이블의 스키마에 매핑합니다. 이 프로세스는 다음 단계를 따릅니다.

  1. 스키마 검색: 시스템은 BigLake metastore에서 메타데이터를 검색하여 테이블 구조, 열 이름, 데이터 유형을 파악합니다.
  2. SQL 생성: LLM이 BigQuery 엔진 및 기본 데이터 형식과 호환되는 SQL 쿼리를 생성합니다.
  3. 실행: BigQuery는 생성된 SQL 쿼리를 BigLake의 개방형 형식 데이터에 대해 직접 실행합니다.
  4. 대답: 결과가 대화형 인터페이스에 반환되며, 요약이나 시각화가 함께 제공되는 경우가 많습니다.

데이터 에이전트 관리, 가격 책정, 권장사항 등 대화형 분석에 대한 자세한 내용은 대화형 분석 개요를 참고하세요.

지원되는 형식

대화형 분석은 자연어 질문을 SQL 쿼리로 변환합니다. Apache Iceberg 테이블과 같은 BigLake metastore에서 지원하는 개방형 테이블 형식을 지원합니다.

시작하기 전에

데이터를 쿼리하려면 먼저 BigLake 메타스토어에 외부 테이블을 등록해야 합니다. BigLake metastore는 BigQuery Studio를 외부 개방형 형식 데이터에 연결하는 통합 허브 역할을 합니다. 연결되면 테이블이 BigQuery 내에서 검색 가능한 애셋이 됩니다.

대화형 분석으로 테이블 쿼리

  1. Google Cloud 콘솔에서 BigQuery Studio Agents Hub로 이동합니다.

    Agents Hub로 이동

  2. 데이터 에이전트를 만들거나 기존 데이터 에이전트와 직접 대화를 시작합니다.

  3. BigLake 테이블을 선택합니다.

    BigLake metastore는 이러한 모든 형식을 통합하므로 검색 환경은 표준 BigQuery 테이블을 찾는 것과 동일합니다.

    1. 검색: 지식 소스를 추가할 때 표 검색 및 선택 인터페이스에서 표 이름을 검색합니다. 검색 키워드를 사용하여 다음과 같은 결과를 필터링할 수 있습니다.

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. 소스 확인: 정규화된 이름의 데이터 세트 부분을 확인합니다. 외부 소스에 의해 생성되고 BigLake Metastore에 의해 관리되는 BigLake 테이블은 일반적으로 카탈로그와 네임스페이스를 결합한 형식을 따릅니다. 예를 들면 PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table 또는 PROJECT_ID.sap_catalog.sales.delta_table입니다.

    3. 선택: 선택한 BigLake 테이블을 활성 대화형 컨텍스트에 추가합니다.

  4. 자연어로 질문합니다. 시스템에서 프롬프트를 통합 SQL 쿼리로 자동 변환합니다.

쿼리 정확도 개선

대화형 분석에서 BigLake 스키마와 용어를 더 잘 이해할 수 있도록 데이터 에이전트 구성 옵션을 사용하세요. 이러한 옵션에는 비즈니스 용어집, 검증된 SQL 쿼리, 시스템 안내가 포함됩니다.

다음 단계