데이터 에이전트를 사용하면 대화형 언어를 사용하여 데이터베이스의 데이터와 상호작용할 수 있습니다. 데이터베이스의 테이블 집합에 대한 컨텍스트를 정의하여 데이터 에이전트를 만들 수 있습니다. 이렇게 하면 데이터 에이전트가 자연어 질문을 타겟 사용 사례에 대한 정확한 쿼리로 변환할 수 있습니다.
컨텍스트는 LLM이 정확도가 높은 쿼리를 생성할 수 있도록 지원하는 데이터베이스별 정보입니다. 컨텍스트에는 상담사가 데이터베이스 스키마와 애플리케이션의 비즈니스 로직을 이해하는 데 도움이 되는 템플릿과 패싯 (프래그먼트)이 포함됩니다.
다음 데이터베이스가 지원됩니다.
- PostgreSQL용 AlloyDB
- MySQL용 Cloud SQL
- PostgreSQL용 Cloud SQL
- Spanner
데이터 에이전트를 사용해야 하는 경우
데이터 에이전트를 사용하여 다음과 같은 사용 사례에 적합한 대화형 데이터 애플리케이션을 빌드할 수 있습니다.
- 고객 서비스 자동화: '주문은 어디에 있나요?' 또는 '현재 잔액은 얼마인가요?'와 같은 대량 문의를 처리합니다.
- 이커머스 쇼핑 도우미: '100달러 미만의 러닝화를 보여줘'와 같은 자연어 질문으로 사용자가 대규모 제품 카탈로그를 탐색하도록 지원합니다.
- 예약 시스템: 사용자가 채팅 인터페이스를 통해 예약 가능 여부를 확인하고 약속, 항공편 또는 식사 서비스를 예약할 수 있도록 지원합니다.
- 현장 운영 도구: 모바일 직원이 재고 수준, 부품 가용성 또는 서비스 티켓 세부정보를 실시간으로 쿼리할 수 있습니다.
데이터 에이전트 작동 방식
효과적인 에이전트 애플리케이션을 빌드하려면 에이전트가 데이터 조직과 비즈니스 로직을 이해해야 합니다. 이 정보는 에이전트 컨텍스트 형식으로 제공됩니다.
템플릿과 패싯의 JSON 객체가 포함된 파일에서 에이전트 컨텍스트를 정의합니다. 이러한 컨텍스트 파일은 Gemini CLI를 사용하여 작성합니다. 그런 다음 컨텍스트 파일을 Google Cloud콘솔에서 만든 데이터 에이전트에 업로드합니다. 이 프로세스를 통해 에이전트는 데이터베이스의 특정 스키마와 애플리케이션의 비즈니스 로직을 학습할 수 있습니다.
에이전트 컨텍스트 파일은 다음과 유사합니다.
{
"templates": [
{
"nl_query": "Count prague loan accounts",
"sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = \"Prague\"",
"intent": "How many accounts associated with loans are located in the Prague region?",
"manifest": "How many accounts associated with loans are located in a given city?",
"parameterized": {
"parameterized_intent": "How many accounts associated with loans are located in $1",
"parameterized_sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = $1"
}
}
],
"fragments": [
{
"fragment": "T.\"A11\" BETWEEN 6000 AND 10000",
"intent": "Average salary between 6000 and 10000",
"manifest": "Average salary between a given number and a given number",
"parameterized": {
"parameterized_intent": "Average salary between $1 and $2",
"parameterized_fragment": "T.\"A11\" BETWEEN $1 AND $2"
}
}
]
}
최종 사용자가 자연어 질문을 하면 에이전트는 컨텍스트를 선별하는 개발자가 감사한 템플릿 및 패싯에 질문을 일치시키는 것을 우선시합니다. 에이전트가 일치하는 항목을 식별하면 선택한 쿼리 템플릿과 패싯을 사용하여 데이터베이스 쿼리를 합성합니다. 그러면 에이전트가 데이터베이스에 대해 해당 쿼리를 실행하여 정확한 결과를 반환합니다.
대화형 분석 API의 QueryData 엔드포인트는 자연어 질문에서 SQL 쿼리를 생성할 수 있도록 애플리케이션과의 프로그래매틱 통합을 지원하는 에이전트 도구입니다. 대화형 애플리케이션에서 QueryData 엔드포인트는 대화 기록과 컨텍스트를 관리하는 프레임워크 내에서 사용해야 합니다.
상담사 컨텍스트
에이전트 컨텍스트는 자연어 질문을 특정 데이터베이스의 쿼리로 변환하는 데 에이전트를 안내하는 JSON 형식의 선별된 템플릿 및 패싯으로 구성됩니다. 컨텍스트를 정의하면 일반적인 쿼리 패턴에 대해 정확도가 높은 SQL이 생성됩니다.
정확도를 극대화하기 위해 에이전트 컨텍스트가 예상 애플리케이션 쿼리를 정확하고 포괄적으로 다루는지 확인합니다.
쿼리 템플릿
쿼리 템플릿은 대표적인 자연어 질문과 이에 상응하는 SQL 쿼리로 구성된 선별된 집합입니다. 또한 자연어-SQL 생성에 대한 선언적 근거를 제공하는 설명도 포함됩니다.
쿼리 템플릿 객체는 다음과 유사합니다.
{
"templates": [
{
"nl_query": "Count prague loan accounts",
"sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = \"Prague\"",
"intent": "How many accounts associated with loans are located in the Prague region?",
"manifest": "How many accounts associated with loans are located in a given city?",
"parameterized": {
"parameterized_intent": "How many accounts associated with loans are located in $1",
"parameterized_sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = $1"
}
}
]
},
...
쿼리 템플릿 JSON 객체의 주요 구성요소는 다음과 같습니다.
nl_query: 데이터 에이전트가 처리하는 자연어 질문의 예입니다.sql: 자연어 질문에 대한 SQL 쿼리입니다.intent: 자연어 질문의 목표 또는 목적입니다. 설정하지 않으면 이 값은 기본적으로 자연어 질문으로 설정됩니다.manifest: 일반화된 자동 생성 인텐트 형식입니다.parameterized_intent: 템플릿이 적용되고 자동으로 생성된 인텐트 양식으로, 엔티티 값이 매개변수로 대체됩니다.parameterized_sql: 파라미터화된 인텐트에 해당하는 템플릿이 적용된 자동 생성 SQL 쿼리입니다.
쿼리 패싯
쿼리 패싯은 해당 SQL 술어가 있는 선별된 대표 자연어 조건의 집합입니다. 패싯은 필터링과 조건을 관리하므로 쿼리 템플릿이 패싯별 검색을 실행할 수 있습니다.
쿼리 패싯 (프래그먼트) 객체는 다음과 유사합니다.
{
...
"fragments": [
{
"fragment": "T.\"A11\" BETWEEN 6000 AND 10000",
"intent": "Average salary between 6000 and 10000",
"manifest": "Average salary between a given number and a given number",
"parameterized": {
"parameterized_intent": "Average salary between $1 and $2",
"parameterized_fragment": "T.\"A11\" BETWEEN $1 AND $2"
}
}
]
}
프래그먼트 JSON 객체의 주요 구성요소는 다음과 같습니다.
fragment: SQL 조건자입니다.intent: SQL 술어에 대한 설명입니다.manifest: 일반화된 자동 생성 인텐트 형식입니다.parameterized_intent: 템플릿이 적용되고 자동으로 생성된 인텐트 양식으로, 엔티티 값이 매개변수로 대체됩니다.parameterized_fragment: 템플릿화되고 자동 생성된 프래그먼트 형식으로, 파라미터화된 인텐트에 해당합니다.
제한사항
데이터 에이전트에는 다음과 같은 제한사항이 있습니다.
- 데이터베이스용 에이전트 컨텍스트는 템플릿과 패싯만 지원합니다.
- 데이터베이스용 에이전트 컨텍스트는 Conversational Analytics API의
QueryData엔드포인트에서만 사용됩니다.
다음 단계
- Spanner Studio에서 데이터 에이전트를 만들거나 삭제하는 방법을 알아보세요.