데이터 스토어

데이터 스토어데이터 스토어 도구 가 데이터에서 최종 사용자의 질문에 대한 답변을 찾는 데 사용됩니다. 데이터 스토어는 각각 사용자의 데이터를 참조하는 웹사이트, 문서 또는 서드 파티 시스템의 데이터 모음입니다.

최종 사용자가 에이전트에게 질문하면 에이전트는 제공된 소스 콘텐츠에서 답변을 검색하고 결과를 일관된 에이전트 응답으로 요약합니다. 또한 최종 사용자가 자세히 알아볼 수 있도록 응답 소스에 대한 지원 링크를 제공합니다. 에이전트는 주어진 질문에 답변 스니펫을 최대 5개까지 제공할 수 있습니다.

데이터 스토어 소스

데이터에 다양한 소스를 사용할 수 있습니다.

  • 웹사이트 URL: 도메인 또는 웹페이지 목록에서 웹사이트 콘텐츠를 자동으로 크롤링합니다.
  • BigQuery: 데이터 가져오기 BigQuery 테이블에서
  • Cloud Storage: 데이터 가져오기: Cloud Storage 버킷에서 데이터를 가져옵니다.
  • AlloyDB: PostgreSQL용 AlloyDB 클러스터에서 데이터를 가져옵니다.
  • Bigtable: Bigtable 테이블에서 데이터를 가져옵니다.
  • Firestore: Firestore 컬렉션에서 데이터를 가져옵니다.
  • Cloud SQL: Cloud SQL 테이블에서 데이터를 가져옵니다.
  • Spanner: Spanner 테이블에서 데이터를 가져옵니다.

액세스가 제한된 데이터 스토어 소스

Google은 액세스가 제한된 기능으로 다양한 추가 퍼스트 파티 및 서드 파티 데이터 스토어 소스를 제공합니다. 사용 가능한 소스를 확인하고 액세스를 요청하려면 추가 데이터 스토어 소스를 참고하세요.

웹사이트 콘텐츠

웹사이트 콘텐츠를 소스로 추가할 때 여러 사이트를 추가하거나 제외할 수 있습니다. 사이트를 지정할 때 개별 페이지 또는 *를 패턴의 와일드 카드로 사용할 수 있습니다. 모든 HTML 및 PDF 콘텐츠가 처리됩니다.

웹사이트 콘텐츠를 소스로 사용하는 경우 도메인을 인증 해야 합니다.

제한사항:

데이터 가져오기

BigQuery 또는 Cloud Storage에서 데이터를 가져올 수 있습니다. 이 데이터는 FAQ 형식 또는 구조화되지 않은 형식일 수 있으며, 메타데이터가 있거나 메타데이터가 없을 수 있습니다.

다음과 같은 데이터 가져오기 옵션 을 사용할 수 있습니다.

  • 데이터 추가/업데이트: 제공된 문서를 데이터 스토어에 추가합니다. 새 문서의 ID가 기존 문서와 같으면 새 문서가 기존 문서를 대체합니다.
  • 기존 데이터 재정의: 모든 기존 데이터를 삭제하고 새 데이터를 업로드합니다. 이 작업은 되돌릴 수 없습니다.

FAQ 데이터 스토어

데이터 스토어에는 자주 묻는 질문에 대한 답변이 있습니다. 사용자 질문이 업로드된 질문과 높은 신뢰도로 일치하면 에이전트는 해당 질문에 대한 답변을 수정하지 않고 반환합니다. 에이전트가 표시하는 각 질문과 답변 쌍의 제목과 URL을 제공할 수 있습니다.

데이터를 CSV 형식으로 데이터 스토어에 업로드합니다. 각 파일에는 열을 설명하는 헤더 행이 포함되어야 합니다.

예를 들면 다음과 같습니다.

"question","answer","title","url"
"Why is the sky blue?","The sky is blue because of Rayleigh scattering.","Rayleigh scattering","https://en.wikipedia.org/wiki/Rayleigh_scattering"
"What is the meaning of life?","42","",""

titleurl 열을 생략할 수 있습니다.

"answer","question"
"42","What is the meaning of life?"

업로드 프로세스 중에 파일 확장자에 관계없이 각 파일이 CSV 파일로 처리되는 폴더를 선택할 수 있습니다.

제한사항:

  • , 뒤에 추가 공백 문자가 있으면 오류가 발생합니다.
  • 빈 줄 (파일 끝에 있는 경우에도)로 인해 오류가 발생합니다.

구조화되지 않은 데이터 스토어

구조화되지 않은 데이터 스토어에는 다음과 같은 형식의 콘텐츠가 포함될 수 있습니다.

  • HTML
  • PDF
  • TXT
  • CSV

다른 프로젝트의 Cloud Storage 버킷에서 파일을 가져올 수 있습니다. 이렇게 하려면 가져오기 프로세스에 명시적 액세스 권한을 부여하세요. 오류 메시지의 안내를 따르세요. 오류 메시지에는 가져오기를 실행하기 위해 버킷에 대한 읽기 액세스 권한이 필요한 사용자 이름이 포함됩니다.

제한사항:

  • 최대 파일 크기는 텍스트 기반 형식의 경우 2.5MB, 다른 형식의 경우 100MB입니다.

메타데이터가 포함된 데이터 스토어

제목과 URL을 메타데이터로 제공할 수 있습니다. 대화 중에 에이전트는 이 정보를 제공하여 사용자가 Google 검색 색인 생성기에서 액세스할 수 없는 내부 웹페이지에 빠르게 연결할 수 있도록 지원합니다.

콘텐츠를 메타데이터와 함께 가져오려면 하나 이상의 JSON Lines 파일을 제공해야 합니다. 이 파일의 각 줄은 문서 하나를 설명합니다. 실제 문서를 직접 업로드하지 않습니다. URIs Cloud Storage 경로에 연결되는 는 JSON Lines 파일에 제공됩니다.

JSON Lines 파일을 제공하려면 이러한 파일이 포함된 Cloud Storage 폴더를 제공하세요. 이 폴더에 다른 파일을 넣지 마세요.

필드 설명:

필드 유형 설명
id 문자열 문서의 고유 식별자입니다.
content.mimeType 문자열 문서의 MIME 유형입니다. 'application/pdf' 및 'text/html'이 지원됩니다.
content.uri 문자열 Cloud Storage의 문서 URI입니다.
structData 문자열 선택적 titleurl 필드가 있는 한 줄로 된 JSON 객체입니다.

예를 들면 다음과 같습니다.

{ "id": "d001", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/first_doc.pdf"}, "structData": {"title": "First Document", "url": "https://internal.example.com/documents/first_doc.pdf"} }
{ "id": "d002", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/second_doc.pdf"}, "structData": {"title": "Second Document", "url": "https://internal.example.com/documents/second_doc.pdf"} }
{ "id": "d003", "content": {"mimeType": "text/html", "uri": "gs://example-import/unstructured/mypage.html"}, "structData": {"title": "My Page", "url": "https://internal.example.com/mypage.html"} }

메타데이터가 없는 데이터 스토어

이 유형의 콘텐츠에는 메타데이터가 없습니다. 대신 개별 문서에 대한 URI 링크를 제공합니다. 콘텐츠 유형은 파일 확장자에 따라 결정됩니다.

파싱 및 청크 구성

데이터 소스에 따라 Agent Search에서 정의한 대로 파싱 및 청크 설정을 구성할 수 있습니다.

데이터 스토어 문서에 Cloud Storage 사용

공개된 콘텐츠가 아닌 경우 Cloud Storage 에 콘텐츠를 저장하는 것이 좋습니다. 데이터 스토어 문서를 만들 때는 Cloud Storage 객체의 URL을 gs://bucket-name/folder-name 형식으로 제공합니다. 폴더 내의 각 문서가 데이터 스토어에 추가됩니다.

Cloud Storage 버킷을 만들려면 다음을 수행합니다.

Cloud Storage 빠른 시작 에 따라 버킷을 만들고 파일을 업로드합니다.

언어

지원되는 언어는 언어 참조의 데이터 스토어 열을 참고하세요. 언어 참조

최상의 성능을 위해서는 데이터 스토어를 단일 언어로 만드세요.

데이터 스토어를 만든 후에 선택적으로 데이터 스토어 언어를 지정할 수 있습니다. 데이터 스토어 언어를 설정하면 데이터 스토어를 다른 언어로 구성된 에이전트에 연결할 수 있습니다. 예를 들어 프랑스어 데이터 스토어를 만들어 영어 에이전트에 연결할 수 있습니다.

지원되는 리전

지원되는 리전에 대한 자세한 내용은 리전 참조를 참고하세요.

(액세스가 제한됨) 추가 데이터 스토어 소스

추가 데이터 스토어 유형은 다음 표에 나와 있습니다. 액세스가 제한된 기능으로 제공됩니다. 액세스 요청 양식을 작성하여 액세스를 요청할 수 있습니다. 승인되면 Vertex AI Agent Builder에서 데이터 스토어를 만들 때 이러한 옵션을 볼 수 있습니다.

서드 파티 데이터 스토어 소스

데이터 스토어 소스 설명
Box 조직의 Box 사이트에서 데이터를 가져옵니다.
Confluence Cloud Confluence Cloud 작업공간에서 데이터를 가져옵니다.
Dropbox Dropbox 스토리지에서 데이터를 가져옵니다.
EntraID 조직의 EntraID 시스템에서 데이터를 가져옵니다.
Jira 클라우드 Jira 작업 관리 시스템에서 데이터를 가져옵니다.
OneDrive 조직의 OneDrive 스토리지에서 데이터를 가져옵니다.
Microsoft Outlook Microsoft Outlook에서 데이터를 가져옵니다.
Salesforce Salesforce에서 데이터를 가져옵니다.
ServiceNow ServiceNow에서 데이터를 가져옵니다.
SharePoint 조직의 SharePoint 시스템에서 데이터를 가져옵니다.
Slack Slack에서 데이터를 가져옵니다.
Microsoft Teams Microsoft Teams에서 데이터를 가져옵니다.

커넥터를 사용하여 서드 파티 데이터 스토어 설정

이 섹션에서는 서드 파티 데이터를 사용하여 데이터 스토어를 설정하는 프로세스를 설명합니다. 각 서드 파티 데이터 소스에 관한 구체적인 안내는 생성형 AI 앱 빌더 문서를 참고하세요.

ID 공급업체

ID 공급업체를 사용하면 사용자, 그룹, 인증을 관리할 수 있습니다. 서드 파티 데이터 스토어를 설정할 때 Google ID 공급업체 또는 서드 파티 ID 공급업체를 사용할 수 있습니다.

Google ID 공급업체:

  • 에이전트 사용자는 Google 사용자 인증 정보를 사용하여 로그인합니다. 이는 @gmail.com 이메일 주소 또는 Google을 ID 공급업체로 사용하는 계정 (예: Google Workspace)입니다. 사용자가 Google ID가 시스템에 자동으로 내장되어 있으므로를 사용하여 에이전트와 대화하는 경우 이 단계는 건너뜁니다. Google Cloud
  • Identity and Access Management (IAM)을 사용하여 Google 계정에 대한 액세스 권한을 할당할 수 있습니다.

서드 파티 ID 공급업체:

  • 에이전트 사용자는 Google 이외의 사용자 인증 정보(예: Microsoft 이메일 주소)를 사용하여 로그인합니다.
  • Google 이외의 ID 공급업체를 포함하는를 사용하여 직원 풀 을 만들어야 합니다. Google Cloud 그런 다음 IAM을 사용하여 전체 풀 또는 해당 풀 내의 개별 사용자에게 액세스 권한을 부여할 수 있습니다.
  • 이 메서드는 Google Cloud 조직에서 설정된 프로젝트와 함께 사용할 수 없습니다.@google.com

커넥터

서드 파티 데이터 스토어는 커넥터를 사용하여 구현됩니다. 각 커넥터에는 Dialogflow CX 시스템에 항목으로 저장되는 여러 데이터 스토어가 포함될 수 있습니다.

  • 데이터 스토어를 만들기 전에 각 리전을 단일 ID 공급업체로 설정해야 합니다. Google Cloud > Agent Builder > 설정 해당 리전의 모든 데이터 스토어는 동일한 ID 공급업체를 사용합니다. 직원 풀에서 Google ID 또는 서드 파티 ID를 선택할 수 있습니다. 동일한 Google 사용자 인증 정보가 직원 풀에 있는 경우 다른 ID로 간주됩니다. 예를 들어 test@gmail.comworkforcePools/test-pool/subject/test@gmail.com과 다른 ID로 간주됩니다.
    • 직원 풀을 만듭니다 (필요한 경우).
    • Agent Builder 설정 으로 이동하여 Google ID 또는 서드 파티 ID 를 선택합니다. 저장 을 클릭하여 ID를 리전에 저장합니다.
    • 이제 리전에서 데이터 스토어를 만들 수 있습니다.
  • 각 데이터 스토어는 각 문서와 함께 액세스 제어 목록 (ACL) 데이터를 저장합니다. 이 레코드는 어떤 사용자 또는 그룹이 어떤 항목에 대한 읽기 액세스 권한을 가지고 있는지 추적합니다. 런타임 중에 사용자 또는 그룹 구성원은 읽기 액세스 권한이 있는 항목에서 응답이 제공되는 경우에만 에이전트로부터 응답을 받습니다. 사용자가 데이터 스토어의 항목에 대한 읽기 액세스 권한이 없는 경우 에이전트는 빈 응답을 반환합니다.
  • 데이터 스토어의 데이터는 서드 파티 인스턴스의 사본이므로 주기적으로 새로고침해야 합니다. 새로고침 간격을 시간 또는 일 단위로 구성할 수 있습니다.
  • 데이터 스토어를 구성하고 만들기를 클릭한 후 데이터 스토어가 데이터 스토어 목록에 표시되는 데 최대 1시간이 걸릴 수 있습니다.

데이터 스토어 추적

이 기능에는 두 부분이 포함됩니다.

  1. 에이전트 시뮬레이터에서 데이터 스토어 내부 실행 추적 및 단계 지연 시간 표시
  2. 데이터 스토어 내부 실행 추적 및 단계 지연 시간을 Cloud Logging 및 BigQuery로 내보내기

시뮬레이터에서 데이터 보기

에이전트 시뮬레이터에서 추적 및 실행 데이터를 표시하려면 에이전트 응답 오른쪽에 있는 확장 화살표를 클릭하여 대화 턴에 관한 세부정보를 펼칩니다.

실행 탭에는 다음을 포함한 내부 데이터 스토어 실행 추적이 표시됩니다.

  • 원래 사용자 입력
  • 데이터 스토어 엔진에서 다시 작성한 쿼리
  • 보안 검사 상태, 안정성 검사 상태, 그라운딩 검사 결과, 안전 검사 상태와 같은 실행 단계의 품질 신호
  • 데이터 스토어 검색의 검색 스니펫
  • 스니펫의 지원 문서 목록

지연 시간 탭에는 다양한 데이터 스토어 실행 단계의 시간 그래프가 표시됩니다. 단계 목록은 데이터 스토어가 구성된 방식과 실행 흐름에 따라 다릅니다. 표시되는 데이터에는 다음이 포함될 수 있습니다.

  • FAQ 일치: FAQ 일치 단계를 실행합니다.
  • 쿼리 다시 작성: 원래 사용자 쿼리를 다시 작성합니다.
  • 검색: 스니펫 검색을 실행합니다.
  • 요약: 응답을 요약합니다.
  • 안전 검사: 안전 검사 단계를 실행합니다.

다른 위치에서 추적 데이터 보기

다음 단계

에이전트와 함께 데이터 스토어를 만들고 사용하는 방법을 알아보려면 데이터 스토어 도구 문서를 참고하세요.