Gemini Cloud Assist 사용
이 문서에서는 Gemini Cloud Assist( Gemini for Google Cloud 포트폴리오의 제품)를 사용하여 BigQuery에서 메타데이터, 작업, 쿼리를 이해하고 작업하는 방법을 설명합니다. Gemini Cloud Assist에서 사용할 수 있는 지원되는 사용 사례와 샘플 프롬프트를 제공합니다.
시작하기 전에
Gemini Cloud Assist를 사용하려면 먼저 관리자가 작업 중인 프로젝트 또는 폴더에 Gemini Cloud Assist를 설정하는 단계를 수행해야 합니다.
리소스에 대한 질문과 요청을 지원하려면 Google Cloud 리소스에 대해 Gemini Cloud Assist에 해당 리소스에 대한 적절한 Identity and Access Management (IAM) 권한이 필요합니다. Gemini Cloud Assist는 BigQuery 데이터를 쿼리하라는 프롬프트를 표시할 때 권한을 상속하므로 대부분의 경우 필요한 IAM 권한이 이미 부여되어 있습니다. 자세한 내용은 Gemini Cloud Assist를 사용하기 위한 IAM 요구사항을 참조하세요.
Gemini Cloud Assist 사용
BigQuery 페이지로 이동합니다.
Google Cloud 툴바에서 spark Open or close Gemini AI chat을 클릭하여 Gemini Cloud Assist 채팅을 엽니다.
프롬프트 입력 필드에 프롬프트를 입력합니다.
보내기 보내기를 클릭합니다.
다음 섹션에서는 Gemini Cloud Assist로 실행할 수 있는 작업의 예시와 샘플 프롬프트를 제공합니다.
리소스 탐색
단일 프로젝트 또는 여러 프로젝트에서 데이터 세트 및 테이블 리소스를 검색하고 알아봅니다. Gemini Cloud Assist는 Knowledge Catalog를 사용하여 BigQuery 리소스를 검색합니다. 검색은 사용자의 권한을 사용하여 실행됩니다. 예를 들어 리소스의 메타데이터를 볼 권한이 없는 경우 결과에 표시되지 않습니다. 지원되는 사용 사례는 다음과 같습니다.
이름으로 리소스 검색. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
전자상거래라는 이름의 데이터 세트가 있나요?테이블의 메타데이터에 대해 질문. 이름으로 테이블에 대해 질문하거나 Gemini Cloud Assist가 채팅 기록 또는 활성 쿼리 탭에서 참조되는 테이블을 기반으로 어떤 테이블을 의미하는지 추론하도록 할 수 있습니다. 이름으로 테이블을 지정하는 경우 정규화된 이름을 사용해야 합니다. 테이블의 스키마 또는 파티션 나누기 및 클러스터링과 같은 기타 메타데이터에 대해 질문할 수 있습니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
PROJECT_NAME.DATASET_NAME.TABLE_NAME의 스키마는 무엇인가요?특정 정보를 찾을 수 있는 위치를 묻습니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
지난해 신규 사용자의 연령 및 위치와 같은 인구통계는 어디에서 찾을 수 있나요?
코드 생성
Gemini Cloud Assist를 사용하여 데이터를 쿼리하고 분석하는 데 도움이 되는 SQL 및 Python 코드를 생성할 수 있습니다.
SQL 생성
쿼리가 수행할 작업을 설명하여 SQL 쿼리를 생성합니다. 최상의 결과를 얻으려면 쿼리할 테이블의 이름을 포함하세요. 예를 들어 Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
가장 긴 10개 경로의 기간과
구독자 유형을 보여주는 SQL 쿼리를 생성해 줘.
bigquery-public-data.san_francisco_bikeshare.bikeshare_trips 테이블을 사용해 줘.
Python 코드 생성
Python 코드가 수행할 작업을 설명하여 Python 코드를 생성합니다. 예를 들어 Cloud Assist 패널에서 다음 프롬프트를 입력하여 Gemini에게 BigQuery 매직 구문을 사용하여 공개 데이터 세트에서 penguins 테이블을 쿼리하도록 요청할 수 있습니다.
BigQuery 매직을 사용하여
bigquery-public-data.ml_datasets.penguins 테이블을 쿼리하는 Python 코드를 생성해 줘.
쿼리 예약
프롬프트에 다음 세부정보를 제공하여 쿼리를 예약합니다.
- 일정(예: 매주 월요일 오후 5시 또는 격주 화요일 오전 2시)
- 표시 이름
- 대상 테이블 ID 및 대상 데이터 세트 ID
- 시작 시간
- 종료 시간
- 쓰기 처리(예:
WRITE_EMPTY,WRITE_APPEND또는WRITE_TRUNCATE)
예를 들어 Cloud Assist 패널에 다음과 유사한 프롬프트를 입력할 수 있습니다.
Schedule the query open in the editor to run daily. The display name
should be "test query". Write the results to a new table in mydataset
called scheduled_results. Use WRITE_APPEND. Start it now.
데이터 계보 추적
Gemini Cloud Assist를 사용하여 데이터 계보를 탐색하고 분석할 수 있습니다. 데이터 종속 항목을 이해하고, 구조적 변경사항의 영향을 평가하고, 복잡한 데이터 흐름을 요약하는 데 도움이 될 수 있습니다. 계보를 분석하려면 다음 기능 영역에서 Gemini Cloud Assist에 질문할 수 있습니다.
계보 통계 가져오기. Gemini Cloud Assist에 관련 애셋, 데이터 세트 또는 프로젝트의 총 수와 같은 계보 그래프에 대한 정량적 데이터를 요청합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
Customer_Master에는 업스트림 애셋이 몇 개 있나요?Customer_Interaction_Summary의 업스트림 계보에 포함된 BigQuery 데이터 세트는 몇 개 있나요?Marketing_Interaction의 업스트림 그래프에 있는 모든 고유 애셋의 개수를 제공해 줘.
직접 종속 항목 분석. 1홉 관계를 분석하여 특정 애셋의 직접 상위 요소 (소스) 또는 직접 하위 요소 (소비자)를 식별합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
Customer_Master의 직접 소스는 무엇인가요?Card_Master 테이블의 직접 소비자는 무엇인가요?Web_Session_Validated의 직접 소스는 무엇인가요?
다운스트림 영향 평가. 애셋을 수정하거나 삭제할 때의 다운스트림 결과를 이해합니다. 깊이 (홉 수) 또는 특정 프로젝트 경계로 이러한 프롬프트를 범위 지정할 수 있습니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
Customer_Master를 삭제하면 어떤 애셋이 영향을 받나요?2홉 내에서 Customer_Master의 다운스트림 애셋을 보여 줘.Customer_Master를 변경하면 'data-lineage-manual-tests' 프로젝트의 애셋에 영향을 미치나요?
루트 소스 및 최종 대상 식별. 중간 변환 단계를 우회하여 데이터의 최종 출처 또는 최종 대상을 찾습니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
Customer_Master의 모든 최종 데이터 소스는 무엇인가요?중간 테이블을 제외한 Transaction_Data_Enriched의 원래 데이터 소스는 무엇인가요?Card_Data_Validated의 최종 데이터 대상은 무엇인가요?
애셋 간 데이터 흐름 추적. Gemini Cloud Assist에 두 개의 알려진 애셋 간의 특정 연결, 경로 또는 데이터 흐름을 설명해 달라고 요청합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
Customer_Master는 Customer_Data_Raw에 어떻게 종속되나요?데이터 흐름은 Customer_Data_Raw에서 Customer_Profile_Snapshot으로 어떻게 흐르나요?Customer_Data_Raw와 Alert_Fact 간에는 홉이 몇 개 있나요?
애셋 유형 또는 이름으로 계보 필터링. 특정 유형의 연결된 애셋 (예: BigQuery 뷰 또는 Looker 대시보드) 또는 특정 이름 지정 패턴과 일치하는 애셋을 검색합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
Customer_Master가 BigQuery 뷰에서 사용되나요?Customer_Master의 다운스트림에 Looker 대시보드가 있나요?Customer_Master의 업스트림 테이블 중 이름에 'Country'가 있는 테이블은 무엇인가요?
계보 그래프 요약. 특정 목록 또는 개수 대신 애셋 계보의 자연어 개요를 요청합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
Web_Session_Validated에 종속된 애셋의 요약을 제공해 줘.이 테이블의 다운스트림 계보를 요약해 줘.bigquery:PROJECT_NAME.DATASET_NAME의 계보는 무엇인가요?
작업 분석
개인 작업 기록 및 프로젝트 작업 기록을 비롯하여 프로젝트에서 실행된 작업에 대해 자세히 알아보고 다음 사용 사례를 지원합니다.
장기 실행 쿼리 디버그. 슬롯 경합, 스캔된 행 수, 데이터 볼륨 등 예상보다 오래 걸릴 수 있는 작업의 현재 상태와 이유를 알아봅니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
이 작업이 이렇게 오래 걸리는 이유는 무엇인가요? JOB_ID실패한 작업의 원인 분석. 특정 쿼리가 실패한 이유를 알아봅니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
JOB_ID이(가) 실패한 이유는 무엇인가요?리소스 집약적인 쿼리 찾기. 처리된 바이트 수 추정치를 기준으로 가장 비용이 많이 드는 쿼리를 알아봅니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.
지난 2일 동안 실행한 쿼리 중 가장 비용이 많이 드는 3개의 쿼리는 무엇인가요?
BigQuery 관리
작업 탐색기에서 Gemini Cloud Assist와 채팅하여 성능을 모니터링하고, 용량을 분석하고, 비용을 최적화할 수 있습니다. 예를 들어 Gemini Cloud Assist를 사용하여 다음 작업을 실행할 수 있습니다.
예약 및 용량 분석. 자연어를 사용하여 컴퓨팅 사용률을 모니터링하고 병목 현상을 식별합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력할 수 있습니다.
지난 24시간 동안의 예약 성능을 분석해 줘.'프로덕션' 예약을 사용하는 상위 프로젝트와 사용자를 보여 줘.현재 용량이 최대 부하에 충분한가요?
작업 모니터링 및 비교. 워크로드를 비교하여 성능 변화를 파악합니다. 병목 현상과 최적화 기회를 강조하는 작업 실적 요약을 가져오거나, 여러 작업의 실행 세부정보를 직접 비교하여 회귀 또는 개선사항을 식별할 수 있습니다.
워크로드 관리 구성. 자연어를 사용하여 할당 및 약정을 비롯한 BigQuery 예약 설정을 검사하고 관리합니다. 이 기능을 사용하면 자동 확장 구성, 유휴 슬롯 관리, 버전별 세부정보를 확인할 수 있습니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력할 수 있습니다.
자동 확장이 사용 설정된 예약을 나열해 줘.PROJECT_ID의 할당을 가져와 줘.예약 RESERVATION_NAME의 구성은 무엇인가요?약정을 나열해 줘.유휴 슬롯 무시가 구성된 예약은 몇 개 있나요?버전 Enterprise별로 모든 예약을 나열해 줘.모든 현재 예약을 나열하고 각 예약의 slot_capacity 및 autoscale_max_slots를 보여 줘.
상위 리소스 식별. BigQuery 리소스의 기본 소비자를 식별합니다. 어시스턴트는 특정 프로젝트 또는 예약 내에서 슬롯 사용률을 기준으로 상위 사용자 및 작업을 표시할 수 있습니다. 이 지원은 작업, 사용자, 프로젝트, 예약을 비롯한 중요한 BigQuery 리소스 전반에 걸쳐 포괄적인 관리 지원을 제공합니다. 어시스턴트는 슬롯 사용량 및 작업 기간과 같은 주요 성능 측정항목을 분석하여 모니터링을 간소화하고 리소스 할당을 최적화하는 데 도움이 되는 실행 가능한 통계를 제공합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력할 수 있습니다.
내 프로젝트에서 슬롯 사용량이 가장 많은 상위 사용자는 누구인가요?지난 1시간 동안 예약 RESERVATION_NAME에서 가장 많은 슬롯을 사용하는 상위 작업을 보여 줘.
다음 단계
- Gemini Cloud Assist에 대해 자세히 알아봅니다.
- 를 위한 Gemini에서 사용자 데이터를 사용하는 방법 알아보기 Google Cloud