데이터 에이전트 개요

데이터 에이전트를 사용하면 대화형 언어를 사용하여 데이터베이스의 데이터와 상호작용할 수 있습니다. 데이터베이스에서 테이블 집합의 컨텍스트를 정의하여 데이터 에이전트를 만들 수 있습니다. 이렇게 하면 데이터 에이전트가 자연어 질문을 대상 사용 사례에 대한 정확한 쿼리로 변환할 수 있습니다.

컨텍스트는 LLM이 높은 정확도로 쿼리를 생성할 수 있도록 하는 데이터베이스별 정보입니다. 컨텍스트에는 에이전트가 데이터베이스 스키마와 애플리케이션의 비즈니스 로직을 이해하는 데 도움이 되는 템플릿과 패싯이 포함됩니다.

다음 데이터베이스가 지원됩니다.

  • PostgreSQL용 AlloyDB
  • MySQL용 Cloud SQL
  • PostgreSQL용 Cloud SQL
  • Spanner

데이터 에이전트를 사용해야 하는 경우

데이터 에이전트를 사용하여 다음과 같은 사용 사례에 적합한 대화형 데이터 애플리케이션을 빌드할 수 있습니다.

  • 고객 서비스 자동화: '내 주문은 어디에 있나요?' 또는 '현재 잔액은 얼마인가요?'와 같은 대량 문의를 처리합니다.
  • 이커머스 쇼핑 도우미: '100달러 미만의 조깅화를 보여 줘'와 같은 자연어 쿼리를 사용하여 사용자가 대규모 제품 카탈로그를 탐색할 수 있도록 지원합니다.
  • 예약 시스템: 사용자가 채팅 인터페이스를 통해 예약 가능 여부를 확인하고 약속, 항공편 또는 식사 서비스를 예약할 수 있도록 지원합니다.
  • 현장 운영 도구: 모바일 직원이 재고 수준, 부품 가용성 또는 서비스 티켓 세부정보를 실시간으로 쿼리할 수 있도록 지원합니다.

데이터 에이전트 작동 방식

효과적인 에이전트 애플리케이션을 빌드하려면 에이전트가 데이터 구성 및 비즈니스 로직을 이해해야 합니다. 이 정보는 에이전트 컨텍스트 형식으로 제공됩니다.

템플릿 및 패싯의 JSON 객체가 포함된 파일에서 에이전트 컨텍스트를 정의합니다. Gemini CLI를 사용하여 이러한 컨텍스트 파일을 작성합니다. 그런 다음 콘솔에서 만든 데이터 에이전트에 컨텍스트 파일을 업로드합니다. Google Cloud이 프로세스를 통해 에이전트는 데이터베이스의 특정 스키마와 애플리케이션의 비즈니스 로직을 학습할 수 있습니다.

에이전트 컨텍스트 파일은 다음과 유사합니다.

{
  "templates": [
    {
      "nl_query": "Count prague loan accounts",
      "sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = \"Prague\"",
      "intent": "How many accounts associated with loans are located in the Prague region?",
      "manifest": "How many accounts associated with loans are located in a given city?",
      "parameterized": {
        "parameterized_intent": "How many accounts associated with loans are located in $1",
        "parameterized_sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = $1"
      }
    }
  ],
  "facets": [
    {
      "sql_snippet": "T.\"A11\" BETWEEN 6000 AND 10000",
      "intent": "Average salary between 6000 and 10000",
      "manifest": "Average salary between a given number and a given number",
      "parameterized": {
         "parameterized_intent": "Average salary between $1 and $2",
         "parameterized_sql_snippet": "T.\"A11\" BETWEEN $1 AND $2"
      }
    }
  ]
}

최종 사용자가 자연어 질문을 하면 에이전트는 컨텍스트를 선별하는 개발자가 감사한 템플릿 및 패싯에 질문을 일치시키는 것을 우선시합니다. 에이전트가 일치하는 항목을 식별하면 선택한 쿼리 템플릿과 패싯을 사용하여 데이터베이스 쿼리를 합성합니다. 그런 다음 에이전트는 데이터베이스에 대해 해당 쿼리를 실행하여 정확한 결과를 반환합니다.

QueryData 엔드포인트는 Conversational Analytics API에서 애플리케이션과의 프로그래매틱 통합을 지원하여 자연어 질문에서 SQL 쿼리를 생성할 수 있도록 하는 에이전트 도구입니다. 대화형 애플리케이션에서 QueryData 엔드포인트는 대화 기록 및 컨텍스트를 관리하는 프레임워크 내에서 사용해야 합니다.

에이전트 컨텍스트

에이전트 컨텍스트는 에이전트가 자연어 질문을 특정 데이터베이스의 쿼리로 변환하도록 안내하는 JSON 형식의 선별된 템플릿 및 패싯 집합으로 구성됩니다. 컨텍스트를 정의하면 일반적인 쿼리 패턴에 대해 높은 정확도의 SQL 생성이 보장됩니다.

정확도를 극대화하려면 에이전트 컨텍스트가 정확하고 예상되는 애플리케이션 쿼리를 포괄적으로 다루는지 확인하세요.

에이전트 및 에이전트 컨텍스트는 us-central1, us-east1, europe-west4, asia-southeast1 리전에서 만들 수 있습니다.

쿼리 템플릿

쿼리 템플릿은 해당 SQL 쿼리가 포함된 선별된 대표적인 자연어 질문 집합입니다. 또한 자연어-SQL 생성에 사용되는 선언적 근거를 제공하는 설명도 포함되어 있습니다.

쿼리 템플릿 객체는 다음과 유사합니다.

{
  "templates": [
    {
      "nl_query": "Count prague loan accounts",
      "sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = \"Prague\"",
      "intent": "How many accounts associated with loans are located in the Prague region?",
      "manifest": "How many accounts associated with loans are located in a given city?",
      "parameterized": {
        "parameterized_intent": "How many accounts associated with loans are located in $1",
        "parameterized_sql": "SELECT COUNT(T1.account_id) FROM bird_dev_financial.account AS T1 INNER JOIN bird_dev_financial.loan AS T2 ON T1.account_id = T2.account_id INNER JOIN bird_dev_financial.district AS T3 ON T1.district_id = T3.district_id WHERE T3.\"A3\" = $1"
      }
    }
  ]
},
...

쿼리 템플릿 JSON 객체의 주요 구성요소는 다음과 같습니다.

  • nl_query: 데이터 에이전트가 처리하는 자연어 쿼리의 예입니다.
  • sql: 자연어 쿼리의 SQL 쿼리입니다.
  • intent: 자연어 쿼리의 목표 또는 목적입니다. 설정하지 않으면 이 값은 기본적으로 자연어 쿼리로 설정됩니다.
  • manifest: 일반화된 자동 생성된 인텐트 형식입니다.
  • parameterized_intent: 매개변수로 대체된 항목 값이 있는 템플릿화된 자동 생성된 인텐트 형식입니다.
  • parameterized_sql: 매개변수화된 인텐트에 해당하는 템플릿화된 자동 생성된 SQL 쿼리 형식입니다.

쿼리 패싯

쿼리 패싯은 해당 SQL 술어가 포함된 선별된 대표적인 자연어 조건 집합입니다. 패싯은 필터링 및 조건을 관리하므로 쿼리 템플릿이 패싯별 검색을 수행할 수 있습니다.

쿼리 패싯 객체는 다음과 유사합니다.

{
...
"facets": [
    {
      "sql_snippet": "T.\"A11\" BETWEEN 6000 AND 10000",
      "intent": "Average salary between 6000 and 10000",
      "manifest": "Average salary between a given number and a given number",
      "parameterized": {
         "parameterized_intent": "Average salary between $1 and $2",
         "parameterized_sql_snippet": "T.\"A11\" BETWEEN $1 AND $2"
      }
    }
  ]
}

패싯 JSON 객체의 주요 구성요소는 다음과 같습니다.

  • sql_snippet: SQL 스니펫입니다.
  • intent: SQL 술어에 대한 설명입니다.
  • manifest: 일반화된 자동 생성된 인텐트 형식입니다.
  • parameterized_intent: 매개변수로 대체된 항목 값이 있는 템플릿화된 자동 생성된 인텐트 형식입니다.
  • parameterized_sql_snippet: 매개변수화된 인텐트에 해당하는 템플릿화된 자동 생성된 sql_snippet 형식입니다.

제한사항

데이터 에이전트에는 다음과 같은 제한사항이 있습니다.

  • SQL Server용 Cloud SQL은 지원되지 않습니다.
  • 데이터베이스의 에이전트 컨텍스트는 템플릿과 패싯만 지원합니다.
  • 데이터베이스의 에이전트 컨텍스트는 Conversational Analytics API의 QueryData 엔드포인트에서만 사용됩니다.

다음 단계