- 리소스: DataStore
- JSON 표현
- ContentConfig
- AdvancedSiteSearchConfig
- LanguageInfo
- NaturalLanguageQueryUnderstandingConfig
- Mode(최빈값)
- BillingEstimation
- WorkspaceConfig
- 유형
- DocumentProcessingConfig
- ChunkingConfig
- LayoutBasedChunkingConfig
- ParsingConfig
- DigitalParsingConfig
- OcrParsingConfig
- LayoutParsingConfig
- HealthcareFhirConfig
- ServingConfigDataStore
- ConfigurableBillingApproach
- 메서드
리소스: DataStore
DataStore는 DataStore 수준에서 전역 설정과 구성을 캡처합니다.
JSON 표현 |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
필드 | |
---|---|
name |
변경할 수 없습니다. 식별자. 데이터 스토어의 전체 리소스 이름입니다. 형식은 이 필드는 UTF-8로 인코딩된 문자열이어야 하며 길이 제한은 1,024자(영문 기준)입니다. |
displayName |
필수 항목입니다. 데이터 스토어 표시 이름입니다. 이 필드는 UTF-8로 인코딩된 문자열이어야 하며 길이 제한은 128자(영문 기준)입니다. 그렇지 않으면 INVALID_ARGUMENT 오류가 반환됩니다. |
industryVertical |
변경할 수 없습니다. 데이터 스토어가 등록하는 업종입니다. |
solutionTypes[] |
데이터 스토어가 등록되는 솔루션입니다. 각
|
defaultSchemaId |
출력 전용입니다. 이 데이터 저장소와 연결된 기본 |
contentConfig |
변경할 수 없습니다. 데이터 스토어의 콘텐츠 구성입니다. 이 필드를 설정하지 않으면 서버 동작은 기본적으로 |
createTime |
출력 전용입니다. 생성된 출력은 항상 Z-정규화되고 소수점 이하 0, 3, 6 또는 9자리인 RFC 3339를 사용합니다. 'Z' 이외의 오프셋도 허용됩니다. 예를 들면 |
advancedSiteSearchConfig |
(선택사항) 고급 사이트 검색 구성입니다. |
languageInfo |
DataStore의 언어 정보입니다. |
naturalLanguageQueryUnderstandingConfig |
(선택사항) 자연어 쿼리 이해를 위한 구성입니다. |
kmsKeyName |
입력 전용입니다. 생성 시 이 데이터 스토어를 보호하는 데 사용되는 KMS 키입니다. CMEK 조직 정책 보호를 준수해야 하는 요청에 대해 설정해야 합니다. 이 필드가 설정되고 성공적으로 처리되면 cmekConfig 필드에 표시된 대로 데이터 스토어가 KMS 키로 보호됩니다. |
cmekConfig |
출력 전용입니다. DataStore의 CMEK 관련 정보입니다. |
billingEstimation |
출력 전용입니다. 청구를 위한 데이터 크기 추정치입니다. |
aclEnabled |
변경할 수 없습니다.
현재 ACL은 |
workspaceConfig |
작업공간 데이터의 데이터 스토어 유형 구성을 저장하는 구성입니다. |
documentProcessingConfig |
문서 이해 및 보강을 위한 구성입니다. |
startingSchema |
이 이 필드는 제공된 스키마는 스키마에 관한 특정 규칙에 따라 검증됩니다. 이 문서에서 자세히 알아보세요. |
healthcareFhirConfig |
(선택사항) |
servingConfigDataStore |
(선택사항) DataStore 수준에서 서빙 구성을 저장합니다. |
identityMappingStore |
변경할 수 없습니다. 연결된 |
isInfobotFaqDataStore |
(선택사항) 설정된 경우 이 데이터 스토어는 Infobot FAQ 데이터 스토어입니다. |
configurableBillingApproach |
(선택사항) 구성 가능한 결제 접근 방식의 구성입니다. 다음과 같이 표시됩니다. |
ContentConfig
데이터 스토어의 콘텐츠 구성입니다.
열거형 | |
---|---|
CONTENT_CONFIG_UNSPECIFIED |
기본값 |
NO_CONTENT |
Document.content 이 없는 문서만 포함합니다. |
CONTENT_REQUIRED |
Document.content 이(가) 있는 문서만 포함합니다. |
PUBLIC_WEBSITE |
데이터 스토어는 공개 웹사이트 검색에 사용됩니다. |
GOOGLE_WORKSPACE |
데이터 스토어는 작업공간 검색에 사용됩니다. 작업공간 데이터 저장소의 세부정보는 WorkspaceConfig 에 명시되어 있습니다. |
AdvancedSiteSearchConfig
고급 사이트 검색의 구성 데이터입니다.
JSON 표현 |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
필드 | |
---|---|
disableInitialIndex |
true로 설정하면 DataStore의 초기 색인 생성이 사용 중지됩니다. |
disableAutomaticRefresh |
true로 설정하면 DataStore의 자동 새로고침이 사용 중지됩니다. |
LanguageInfo
DataStore의 언어 정보입니다.
JSON 표현 |
---|
{ "languageCode": string, "normalizedLanguageCode": string, "language": string, "region": string } |
필드 | |
---|---|
languageCode |
DataStore의 언어 코드입니다. |
normalizedLanguageCode |
출력 전용입니다. 이는 languageCode의 정규화된 형식입니다. 예: |
language |
출력 전용입니다. 정규화된 languageCode의 언어 부분입니다. 예: |
region |
출력 전용입니다. 정규화된 languageCode의 지역 부분입니다(있는 경우). 예: |
NaturalLanguageQueryUnderstandingConfig
자연어 쿼리 이해를 위한 구성입니다.
JSON 표현 |
---|
{
"mode": enum ( |
필드 | |
---|---|
mode |
자연어 쿼리 이해 모드입니다. 이 필드를 설정하지 않으면 기본값은 |
모드
자연어 쿼리 이해 모드입니다. NaturalLanguageQueryUnderstandingConfig.Mode가 ENABLED인 경우 SearchRequest의 NaturalLanguageQueryUnderstandingSpec.FilterExtractionCondition이 ENABLED이면 검색 요청에 자연어 이해 기능이 사용 설정됩니다.
열거형 | |
---|---|
MODE_UNSPECIFIED |
기본값 |
DISABLED |
자연어 쿼리 이해가 사용 중지되어 있습니다. |
ENABLED |
자연어 쿼리 이해가 사용 설정되어 있습니다. |
BillingEstimation
데이터 스토어별 데이터 크기 추정치입니다.
JSON 표현 |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
필드 | |
---|---|
structuredDataSize |
구조화된 데이터의 데이터 크기(바이트)입니다. |
unstructuredDataSize |
비정형 데이터의 데이터 크기(바이트)입니다. |
websiteDataSize |
웹사이트의 데이터 크기(바이트)입니다. |
structuredDataUpdateTime |
구조화된 데이터의 마지막 업데이트 타임스탬프입니다. 생성된 출력은 항상 Z-정규화되고 소수점 이하 0, 3, 6 또는 9자리인 RFC 3339를 사용합니다. 'Z' 이외의 오프셋도 허용됩니다. 예를 들면 |
unstructuredDataUpdateTime |
비정형 데이터의 마지막 업데이트 타임스탬프입니다. 생성된 출력은 항상 Z-정규화되고 소수점 이하 0, 3, 6 또는 9자리인 RFC 3339를 사용합니다. 'Z' 이외의 오프셋도 허용됩니다. 예를 들면 |
websiteDataUpdateTime |
웹사이트의 마지막 업데이트 타임스탬프입니다. 생성된 출력은 항상 Z-정규화되고 소수점 이하 0, 3, 6 또는 9자리인 RFC 3339를 사용합니다. 'Z' 이외의 오프셋도 허용됩니다. 예를 들면 |
WorkspaceConfig
작업공간 데이터의 데이터 스토어 유형 구성을 저장하는 구성
JSON 표현 |
---|
{
"type": enum ( |
필드 | |
---|---|
type |
Google Workspace 데이터 소스입니다. |
dasherCustomerId |
난독화된 Dasher 고객 ID입니다. |
superAdminServiceAccount |
(선택사항) 액세스 토큰 생성에 사용될 워크스페이스의 최고 관리자 서비스 계정입니다. 현재는 네이티브 Google Drive 커넥터 데이터 수집에만 사용됩니다. |
superAdminEmailAddress |
(선택사항) 액세스 토큰 생성에 사용될 워크스페이스의 최고 관리자 이메일 주소입니다. 현재는 네이티브 Google Drive 커넥터 데이터 수집에만 사용됩니다. |
유형
이 DataStore에서 지원하는 Workspace 앱의 유형을 지정합니다.
열거형 | |
---|---|
TYPE_UNSPECIFIED |
기본값은 지정되지 않은 Workspace 유형입니다. |
GOOGLE_DRIVE |
Workspace 데이터 저장소에 Drive 데이터가 포함됨 |
GOOGLE_MAIL |
Workspace 데이터 저장소에 메일 데이터가 포함됨 |
GOOGLE_SITES |
Workspace 데이터 스토어에 사이트 데이터가 포함됨 |
GOOGLE_CALENDAR |
Workspace 데이터 스토어에 Calendar 데이터가 포함됨 |
GOOGLE_CHAT |
Workspace 데이터 저장소에 Chat 데이터가 포함됨 |
GOOGLE_GROUPS |
Workspace 데이터 스토어에 그룹 데이터가 포함됨 |
GOOGLE_KEEP |
Workspace 데이터 스토어에 Keep 데이터가 포함됨 |
GOOGLE_PEOPLE |
Workspace 데이터 스토어에 사용자 데이터가 포함됨 |
DocumentProcessingConfig
DataStore
의 싱글톤 리소스입니다. DataStore
이 생성되고 DataStore
이 DataStore.ContentConfig.CONTENT_REQUIRED
로 설정될 때 비어 있으면 기본 파서는 디지털 파서로 기본 설정됩니다.
JSON 표현 |
---|
{ "name": string, "chunkingConfig": { object ( |
필드 | |
---|---|
name |
문서 처리 구성의 전체 리소스 이름입니다. 형식은 |
chunkingConfig |
청크 모드 사용 설정 여부입니다. |
defaultParsingConfig |
기본 문서 파서의 구성입니다. 지정하지 않으면 기본 DigitalParsingConfig로 구성되며 기본 파싱 구성이 문서 파싱의 모든 파일 형식에 적용됩니다. |
parsingConfigOverrides |
파일 형식에 따라 기본 파싱 구성을 재정의하는 파일 형식의 매핑입니다. 지원되는 키:
|
ChunkingConfig
청크 생성 구성의 구성입니다.
JSON 표현 |
---|
{ // Union field |
필드 | |
---|---|
통합 필드 chunk_mode . 청크의 동작을 정의하는 추가 구성입니다. chunk_mode 은 다음 중 하나여야 합니다. |
|
layoutBasedChunkingConfig |
레이아웃 기반 청킹의 구성입니다. |
LayoutBasedChunkingConfig
레이아웃 기반 청킹의 구성입니다.
JSON 표현 |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
필드 | |
---|---|
chunkSize |
각 청크의 토큰 크기 제한입니다. 지원되는 값: 100~500 (양 끝값 포함) 기본값: 500 |
includeAncestorHeadings |
컨텍스트 손실을 방지하기 위해 문서 중간에서 청크에 여러 수준의 제목을 추가할지 여부입니다. 기본값은 False입니다. |
ParsingConfig
특정 유형의 문서 파서에 적용되는 관련 구성입니다.
JSON 표현 |
---|
{ // Union field |
필드 | |
---|---|
통합 필드 type_dedicated_config . 문서 처리 유형의 구성입니다. type_dedicated_config 은 다음 중 하나여야 합니다. |
|
digitalParsingConfig |
디지털 파서에 적용된 구성입니다. |
ocrParsingConfig |
OCR 파서에 적용된 구성입니다. 현재는 PDF에만 적용됩니다. |
layoutParsingConfig |
레이아웃 파서에 적용된 구성입니다. |
DigitalParsingConfig
이 유형에는 필드가 없습니다.
문서의 디지털 파싱 구성입니다.
OcrParsingConfig
문서의 OCR 파싱 구성입니다.
JSON 표현 |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
필드 | |
---|---|
enhancedDocumentElements[] |
[지원 중단됨] 이 필드는 지원 중단되었습니다. 추가 향상된 문서 요소 처리를 사용하려면 |
useNativeText |
true인 경우 기본 텍스트가 포함된 페이지에서 OCR 텍스트 대신 기본 텍스트를 사용합니다. |
LayoutParsingConfig
문서의 레이아웃 파싱 구성입니다.
JSON 표현 |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
필드 | |
---|---|
enableTableAnnotation |
(선택사항) true인 경우 파싱 중에 LLM 기반 주석이 표에 추가됩니다. |
enableImageAnnotation |
(선택사항) true인 경우 파싱 중에 LLM 기반 주석이 이미지에 추가됩니다. |
structuredContentTypes[] |
(선택사항) 문서에서 추출할 필수 구조 유형을 포함합니다. 지원되는 값:
|
excludeHtmlElements[] |
(선택사항) 파싱된 콘텐츠에서 제외할 HTML 요소 목록입니다. |
excludeHtmlClasses[] |
(선택사항) 파싱된 콘텐츠에서 제외할 HTML 클래스 목록입니다. |
excludeHtmlIds[] |
(선택사항) 파싱된 콘텐츠에서 제외할 HTML ID 목록입니다. |
enableGetProcessedDocument |
(선택사항) true인 경우 처리된 문서를 GetProcessedDocument API에서 사용할 수 있습니다. |
HealthcareFhirConfig
HEALTHCARE_FHIR
세로의 데이터 스토어 구성
JSON 표현 |
---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
필드 | |
---|---|
enableConfigurableSchema |
|
enableStaticIndexingForBatchIngestion |
|
ServingConfigDataStore
DataStore 수준의 서빙 구성에 관한 정보를 저장합니다.
JSON 표현 |
---|
{ "disabledForServing": boolean } |
필드 | |
---|---|
disabledForServing |
(선택사항) true로 설정하면 DataStore를 사용하여 검색 요청을 처리할 수 없습니다. |
ConfigurableBillingApproach
구성 가능한 결제 접근 방식의 구성입니다.
열거형 | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
기본값 Spark 및 비Spark 구성 불가능한 결제 접근 방식 |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
비임베딩 스토리지를 위한 색인 코어에 구독 기본 요금 + 초과분 청구를 사용합니다. |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
스토리지 부가기능을 삽입하는 데 사용량 기반 종량제 청구를 사용합니다. |
메서드 |
|
---|---|
|
키워드 추천으로 지정된 사용자 입력을 완료합니다. |
|
DataStore 를 만듭니다. |
|
DataStore 를 삭제합니다. |
|
DataStore 을 가져옵니다. |
|
SiteSearchEngine 를 가져옵니다. |
|
프로젝트와 연결된 모든 DataStore 를 나열합니다. |
|
DataStore 업데이트 |
|
커스텀 모델을 학습시킵니다. |