대화형 분석 개요
BigQuery의 대화형 분석을 사용하면 자연어를 사용하여 데이터에 관해 에이전트와 채팅할 수 있습니다. 데이터에 관한 답변을 얻으려면 다음을 수행하면 됩니다.
- 선택한 테이블, 뷰, 그래프 또는 사용자 정의 함수 (UDF)와 같은 지식 소스 집합의 데이터 컨텍스트 및 쿼리 처리 안내를 자동으로 정의하는 데이터 에이전트를 만듭니다.
- 필요한 경우 커스텀 테이블 및 필드 메타데이터, 데이터를 해석하고 쿼리하는 에이전트 안내 또는 검증된 쿼리(이전에는 표준 쿼리 라고 함)를 만들어 특정 사용 사례에 관한 질문에 효과적으로 답변하도록 데이터 에이전트를 구성하는 형식으로 에이전트의 컨텍스트와 안내를 만들 수 있습니다.
에이전트를 맞춤설정하기 전에 먼저 에이전트가 만드는 컨텍스트와 안내를 사용하는 것이 좋습니다.
에이전트에 제공하는 컨텍스트 및 안내의 몇 가지 예는 다음과 같습니다.
- 컨텍스트. 판매 분석을 위한 데이터 에이전트는 단순히 가장 많은 거래를 성사시킨 것이 아니라 가장 높은 수익을 올린 영업 담당자를 '최고 실적자'로 이해하도록 구성할 수 있습니다.
- 안내. 데이터 에이전트에게 '추세'에 관해 질문을 받으면 항상 데이터를 가장 최근 분기로 필터링하거나 결과를 기본적으로 '제품 카테고리'별로 그룹화하도록 안내할 수 있습니다.
데이터 에이전트를 만든 후 자연어를 사용하여 BigQuery 데이터에 관해 질문하는 대화를 나눌 수 있습니다. 하나 이상의 데이터 소스와 직접 대화를 만들어 기본 일회성 질문에 답변할 수도 있습니다.
대화형 분석은 Google Cloud용 Gemini를 기반으로 하며 일부 BigQuery ML 함수를 지원합니다. 자세한 내용은 BigQuery ML 지원을 참고하세요.
를 위한 Gemini에서 사용자 데이터를 사용하는 방법과 시점을 알아보세요. Google Cloud
데이터 에이전트
데이터 에이전트는 하나 이상의 지식 소스와 해당 데이터를 처리하기 위한 사용 사례별 안내 집합으로 구성됩니다. 데이터 에이전트를 만들 때 다음 옵션을 사용하여 구성할 수 있습니다.
- 데이터 에이전트와 함께 테이블, 뷰, UDF와 같은 지식 소스 를 사용합니다. Lakehouse 테이블을 소스로 연결할 수도 있습니다. 자세한 내용은 자연어로 Lakehouse 데이터 쿼리를 참고하세요.
- 커스텀 테이블 및 필드 메타데이터를 제공하여 지정된 사용 사례에 가장 적합한 방식으로 데이터를 설명합니다.
- 다음을 정의하는 등 데이터를 해석하고 쿼리하는 안내를 제공합니다.
- 필드 이름의 동의어 및 비즈니스 용어
- 필터링 및 그룹화를 위한 가장 중요한 필드 및 기본값
- 데이터 에이전트가 에이전트의 응답 구조를 형성하고 조직에서 사용하는 비즈니스 로직을 학습하는 데 사용할 수 있는 검증된 쿼리 를 만듭니다. 검증된 쿼리는 이전에는 표준 쿼리 라고 했습니다. 검증된 쿼리는 지원되는 BigQuery ML 함수 를 사용하고 쿼리 매개변수를 지원할 수 있습니다.
- 각 에이전트에 대해 BigQuery 커스텀 용어집 용어를 만들거나 Knowledge Catalog에서 비즈니스 용어집 용어를 가져옵니다. 이러한 용어는 에이전트가 사용자 프롬프트를 해석하는 데 도움이 됩니다. 각 유형을 사용하는 시기에 관한 조언은 다음을 참고하세요. 용어집 용어 만들기 또는 검토
데이터 에이전트 관리
콘솔의 Google Cloud 에이전트 카탈로그 탭에서 다음 유형의 데이터 에이전트를 만들고, 관리하고, 사용할 수 있습니다.
- 각 Google Cloud 프로젝트의 사전 정의된 샘플 에이전트
- 작성, 생성, 게시한 에이전트 목록
- 다른 사용자가 만들고 나와 공유하는 에이전트 목록
자세한 내용은 데이터 에이전트 만들기를 참고하세요.
대화형 분석 API 및 Data Studio와 같이 데이터 에이전트를 지원하는 프로젝트의 다른 서비스는 BigQuery에서 만든 데이터 에이전트에 액세스할 수 있습니다. 대화형 분석 API를 사용하여 호출하여 Google Cloud 콘솔에서 만든 에이전트에 액세스할 수도 있습니다.
대화
대화는 데이터 에이전트 또는 데이터 소스와의 지속적인 채팅입니다. 테이블 필드 이름을 지정하거나 데이터를 필터링하는 조건을 정의하지 않고도 '판매' 또는 '가장 인기 있는'과 같은 일반적인 용어를 사용하는 다중 질문을 데이터 에이전트에게 할 수 있습니다. PDF와 같은 객체에 있는 데이터에 관해 질문할 수도 있습니다.
사용자에게 반환되는 채팅 응답은 다음과 같은 기능을 제공합니다.
- 텍스트, 코드 또는 이미지 (멀티모달) 형식의 질문에 대한 답변입니다. 답변에는 지원되는 BigQuery ML 함수가 포함될 수 있습니다.
- 적절한 경우 생성된 차트입니다.
- GQL 쿼리 경로의 그래프 시각화입니다.
- 결과 뒤에 있는 에이전트의 추론입니다.
- 사용된 에이전트 및 데이터 소스와 같은 대화에 관한 메타데이터입니다.
데이터 소스와 직접 대화를 만들 때 대화형 분석 API 는 데이터 에이전트가 제공하는 컨텍스트 및 처리 안내 없이 질문을 해석합니다. 이로 인해 직접 대화 결과의 정확성이 떨어질 수 있습니다. 정확성이 더 필요한 경우 데이터 에이전트를 사용하세요.
콘솔을 사용하여 BigQuery에서 대화를 만들고 관리할 수 있습니다. Google Cloud 자세한 내용은 대화로 데이터 분석을 참고하세요.
BigQuery ML 지원
대화형 분석은 데이터 에이전트 및 데이터 소스와의 채팅에 대한 응답과 사용자가 만드는 검증된 SQL 쿼리에서 다음 BigQuery ML 함수를 지원합니다.
지원되는 AI.GENERATE 함수를 사용하려면 생성형 AI 쿼리를 실행하는 데 필요한 권한이 있어야 합니다.
BigQuery ML 사용 사례
지원되는 BigQuery ML 함수를 활성화하려면 다음과 같은 방법으로 사용하세요.
- 에이전트를 만들고 검증된 쿼리를 추가할 때(예: 반복 보고서를 준비하는 데이터 과학자인 경우) 검증된 쿼리에서 지원되는 BigQuery ML 함수를 사용하여 기본값을 설명하고 보고서를 자동화할 수 있습니다.
- 대화 또는 키워드를 사용하는 검증된 쿼리에서 에이전트에게 데이터에 관한 개략적인 질문을 하면 에이전트가 질문에 대한 응답으로 BigQuery ML SQL을 생성합니다.
다음 표에서는 BigQuery ML 사용을 활성화하는 원샷 프롬프트의 예를 보여줍니다.
| 사용 사례 | 사용 예시 | 공개 데이터 세트 |
|---|---|---|
| 예측 | '다음 달의 이동 횟수를 예측해 주세요.' | bigquery-public-data.san_francisco_bikeshare.bikeshare_trips |
| 이상 감지 | '2017년을 기준선으로 사용하여 2018년의 일일 이동 횟수에서 이상점을 찾아주세요.' | bigquery-public-data.san_francisco_bikeshare.bikeshare_trips |
| LLM 텍스트 생성 | '스포츠' 카테고리의 각 기사에 대해 본문 열을 1~2문장으로 요약해 주세요.' | bigquery-public-data.bbc_news.fulltext |
그래프 지원
대화형 분석은 그래프 를 데이터 소스로 사용하는 것을 지원합니다. 그래프에 관해 질문하면 에이전트가 GQL 또는 SQL 쿼리를 구성하여 답변합니다. 에이전트는 그래프 라벨 및 속성에 정의한 설명과 동의어 를 사용하여 결과의 품질을 개선할 수 있습니다. 에이전트는 그래프에 정의된 측정항목 을 활용하여 다단계 집계를 실행할 수도 있습니다. 응답에 그래프 경로가 포함된 경우 그래프 시각화가 제공됩니다.
예를 들어
bigquery-public-data.thelook_ecommerce.graph 그래프에 관해 다음과 같은 질문을 할 수 있습니다.
Which product is most popular among 25-year-olds?Show me all bow tie orders in Chicago from users under 25
그래프를 데이터 소스로 사용하는 경우 다음 제한사항이 적용됩니다.
- 에이전트 또는 대화당 최대 하나의 그래프를 데이터 소스로 사용할 수 있습니다.
- 테이블과 그래프를 데이터 소스로 결합할 수 없습니다.
보안
대화형 분석 API IAM 역할 및 권한을 사용하여 BigQuery의 대화형 분석에 대한 액세스를 관리할 수 있습니다. 특정 작업에 필요한 역할에 관한 자세한 내용은 데이터 에이전트 필수 역할 및 대화 필수 역할을 참고하세요.
위치
대화형 분석은 전역적으로 작동하므로 사용할 리전을 선택할 수 없습니다.
가격 책정
데이터 에이전트를 만들고 데이터 에이전트 또는 데이터 소스와 대화할 때 실행되는 쿼리에 대해 BigQuery 컴퓨팅 가격으로 청구됩니다. 미리보기 기간에는 데이터 에이전트 및 대화를 만들고 사용하는 데 추가 요금이 부과되지 않습니다.
권장사항
다음 가이드를 검토하여 대화형 분석 API 사용에 대한 권장사항을 알아봅니다.
- 프로젝트 수준, 사용자 수준, 쿼리 수준 지출 한도를 설정하여 에이전트의 비용을 관리합니다.
- 대화에서 효과적인 질문을 합니다.
- 데이터 에이전트 및 대화의 데이터 보관 및 삭제가 작동하는 방식을 이해합니다.
제한사항
쿼리, 대화, 데이터, 시각화에 관한 제한사항에 관한 자세한 내용은 대화형 분석 API 알려진 제한사항을 참고하세요.
동적 공유 할당량
Vertex AI의 동적 공유 할당량 (DSQ)은 Gemini 모델의 용량을 관리합니다. 기존 할당량과 달리 DSQ를 사용하면 모델 처리량에 대한 프로젝트별 고정 한도 없이 대규모 공유 리소스 풀에 액세스할 수 있습니다.
지연 시간과 같은 성능은 전반적인 시스템 부하에 따라 달라질 수 있습니다. 공유 풀에서 수요가 많은 시간대에는 일시적으로 429 Resource Exhausted 오류가 발생할 수 있습니다. 이러한 오류는 공유 풀 용량이 일시적으로 제한되지만 프로젝트에서 특정 할당량 한도에 도달한 것은 아님을 나타냅니다. 용량을 확인하려면 잠시 기다린 후 요청을 다시 시도하세요.
다음 단계
- 대화형 분석 API에 관해 자세히 알아보세요.
- 데이터 에이전트를 만듭니다.
- 대화로 데이터 분석을 참고하세요.
- Lakehouse에서 대화형 분석 사용