필드 설정 구성

이 페이지에서는 구조화된 데이터, 메타데이터가 포함된 비정형 데이터 또는 맞춤 정형 속성이 있는 웹사이트 데이터용 앱을 설정하도록 스키마 필드를 구성하는 방법을 보여줍니다.

필드 설정을 사용하면 Agent Search가 결과에서 필드를 사용하는 방식을 결정할 수 있습니다. 콘솔의 스키마 탭을 사용하여 필드 설정을 구성할 수 있습니다.Google Cloud

필드 설정은 구조화된 데이터 또는 메타데이터가 있는 비정형 데이터가 포함된 데이터 스토어가 있는 앱에서만 구성할 수 있습니다.

필드 설정

다음 필드 설정은 검색 또는 추천 데이터의 여러 필드 유형에 사용할 수 있지만 모든 데이터 유형에 사용할 수 있는 것은 아닙니다. 스키마에는 개별 필드의 여러 필드 설정이 포함되어 있으며 다음 표에는 스키마 내의 필드에 적용할 수 있는 설정이 포함되어 있습니다. 이러한 필드 설정에는 구조화된 데이터를 사용하는 것이 좋습니다.

설정 정의 목적 사용 사례 예시
색인 생성 가능

필드를 색인 생성 가능으로 설정하면 문서 내의 정형 필드에 필터링, 부스팅, 패싯 생성과 같은 작업을 수행할 수 있습니다.

Object 유형의 필드는 Indexable로 설정할 수 없습니다.

필드를 Indexable로 표시하면 조회를 더 빠르게 할 수 있습니다.

필드를 Indexable로 표시하면 검색 색인의 크기가 커지고 색인 생성이 느려질 수 있습니다.

호텔 데이터 스토어에서 `hotel_chain`과 같은 필드를 색인 생성 가능으로 설정할 수 있습니다.hotel_chain 이렇게 하면 hotel_chain에 순위 지정, 필터링, 부스팅 작업을 적용할 수 있습니다. 예를 들어, 필터링된 호텔 체인이 포함된 검색 결과만 검색에 표시되도록 필터를 적용할 수 있습니다.
검색 가능

검색과 관련이 있을 가능성이 가장 높은 필드는 검색과 관련이 있을 가능성이 가장 높은 필드는 Searchable로 지정됩니다. 필드는 색인 생성 가능하거나 가져오기 가능하지 않아도 검색 가능할 수 있습니다.

텍스트 값이 있는 필드만 검색 가능으로 표시할 수 있습니다. 따라서 숫자 가격 필드는 색인 생성 가능 (필터링 또는 패싯 생성)하지만 전체 텍스트로 검색 가능하지는 않습니다.

필드를 검색 가능으로 설정하면 검색 쿼리에서 해당 필드의 재현율이 향상되어 사용자가 이러한 필드 내의 텍스트를 쿼리하여 웹 페이지와 같은 콘텐츠를 찾을 수 있습니다. 필드를 검색 가능으로 표시하면 순위 지정을 적용할 수 있습니다. 따라서 너무 많은 필드를 검색 가능으로 표시하면 순위 지정 알고리즘이 과포화되고 너무 많은 결과가 반환되어 검색 정확도에 부정적인 영향을 미칠 수 있습니다. 이로 인해 관련성이 없는 검색 결과가 반환될 수 있습니다.

검색 가능한 필드에 상대적 가중치를 적용할 수 있지만 강력한 기본값으로 인해 거의 필요하지 않습니다. 아래의 검색 가능한 필드 가중치 지정을 참조하세요.

인터넷 서비스 제공업체의 지원 티켓 시스템은 각 티켓을 정형 문서로 저장합니다. 이러한 문서에 issue_description 또는 resolution_notes와 같은 검색 가능한 텍스트 필드가 포함되어 있는 경우 지원 상담원은 모뎀 재설정 후 인터넷 속도를 느리게 만드는 방법과 같이 해당 필드의 콘텐츠와 관련된 쿼리를 실행할 수 있습니다. 그러면 시스템은 검색어를 포함하는 문서를 표시합니다. 여기에는 모뎀, 인터넷, 속도가 포함되며, issue_description 또는 resolution_notes 필드 중 하나 또는 둘 다에 해당합니다.

동적 패싯 생성 가능 사용자의 검색을 더 효과적으로 타겟팅하기 위해 컨텍스트 인식 필터를 제공합니다. 필드를 Dynamic Facetable로 설정하면 시스템에서 필드에 있는 고유한 값을 기반으로 대화형 필터 (패싯)를 자동으로 생성할 수 있습니다. 필드를 Dynamic facetable로 설정하면 사용자가 가능한 모든 필터 옵션을 수동으로 미리 정의하지 않고도 수집된 데이터에서 직접 파생된 카테고리 또는 속성을 선택하여 검색 결과를 동적으로 세분화할 수 있습니다. 이렇게 하면 사용자가 검색 범위를 매우 구체적인 웹 콘텐츠로 좁힐 수 있습니다.
Dynamic FacetableSearchable 과 함께 사용하면 더 나은 결과를 얻을 수 있으며, 이는 검색의 재현율과 사용자에게 제공되는 패싯의 품질을 모두 개선합니다.
HR 정책과 같은 내부 기업 기술 자료의 페이지는 department, document_type, 또는 last_modified_date와 같은 데이터와 함께 수집됩니다. 이러한 필드가 dynamic facetable로 태그 지정된 경우 _비용 상환_ 과 같은 용어를 검색하는 직원은 발견된 관련 결과를 기반으로 대화형 필터를 동적으로 생성합니다. 이 경우 웹 인터페이스는 부서: 재무, 출장, 문서 유형: 정책, FAQ 또는 최종 수정일: 이번 분기, 작년에 대한 패싯을 표시할 수 있습니다.
가져오기 가능 검색 쿼리가 일치하는 콘텐츠를 찾으면 검색 엔진은 가져오기 가능한 필드의 값을 가져와 표시하거나 애플리케이션에서 사용할 수 있습니다. 즉, 원본 문서의 정보가 검색 결과의 일부로 표시됩니다. 키 필드 (문서의 고유 식별자)는 가져오기 가능으로 설정됩니다. 가져오기 가능한 필드는 값을 표시할 수 있는 필드와 검색 로직에서만 사용되지만 최종 사용자에게 원시 값을 표시해서는 안 되는 필드를 구분하여 검색 컨텍스트를 제공합니다. 판매자 사이트에서 제품을 검색하는 경우 product_id, name, price, image_url은 가져오기 가능으로 설정하려는 일반적인 필드입니다. 반면에 internal_tracking_code는 관리 목적으로만 색인 생성 및 필터링이 가능하지만 공개 검색 결과에서는 가져오기 가능하지 않습니다.
완성 가능 필드의 콘텐츠를 검색어 추천에 사용할 수 있습니다. 자세한 내용은 자동 완성 구성을 참조하세요.

이 설정을 사용하면 사용자가 입력할 때 실시간 쿼리 추천을 제공하는 데 해당 필드 내의 값 을 사용할 수 있습니다. 이 기능을 사용하면 사용자가 관련 콘텐츠를 찾을 수 있도록 안내하고 검색 프로세스를 가속화할 수 있습니다. 자연어 필터링 사용과 같은 특정 요소 가 이 성능에 영향을 미칠 수 있습니다.

    `product_name`, `brand`, `category`에 `completable` 필드가 설정된 경우 사용자가 `Tech`를 입력하면 자동 완성 추천에 다음이 표시될 수 있습니다.
  • TechCo (brand 필드에서)
  • TechCo UltraBook X1 (product_name 필드에서)
  • Technology GameMaster Pro (another product from the category field)
필터링 가능 추천에서 필드를 사용하여 추천 결과를 필터링하고 사용자에게 표시되는 검색 결과를 결정할 수 있습니다. 추천 필터링 방법에 대한 내용은 추천 필터링을 참조하세요. 필드를 Filterable로 설정하면 사용자를 위한 추천을 맞춤설정할 수 있습니다. 필터링 한도가 적용됩니다. 언어 및 드라마별 필터 설정은 language_code: ANY("en", "fr") OR categories: ANY("drama")와 같을 수 있습니다.

흔히 사용되는 설정 간의 차이점

색인 생성 가능, 검색 가능, 가져오기 가능 필드 설정 간에는 중요한 차이점이 있습니다. 표에는 이러한 차이점이 요약되어 있습니다.

기능 색인 생성 가능 검색 가능 가져오기 가능
기본 역할 검색 엔진에서 필드 콘텐츠를 사용할 수 있도록 합니다. 필드 콘텐츠에 대해 전체 텍스트 쿼리를 허용합니다. 검색 결과에서 필드의 값을 반환할 수 있습니다.
분석 콘텐츠가 처리되어 색인에 배치됩니다. 일반적으로 광범위한 어휘 분석을 거칩니다. 값은 표시를 위해 있는 그대로 저장됩니다.
가능한가요?
...검색 가능? 예 (종종 필수 조건) 해당 사항 없음 반드시 그런 것은 아닙니다 (검색 가능하지 않아도 가져오기 가능할 수 있음).
...가져오기 가능? 반드시 그런 것은 아닙니다. 반드시 그런 것은 아닙니다. 해당 사항 없음
...필터링 가능/정렬 가능/패싯 생성 가능? 예 (일반적으로 이러한 항목의 필수 조건이기도 함) 직접은 아닙니다. 이러한 항목은 색인 생성 가능 필드를 기반으로 빌드되는 별도의 속성입니다. 직접은 아닙니다. 이러한 속성은 필드가 표시되는 방식뿐만 아니라 색인이 생성되고 쿼리되는 방식과 관련이 있습니다.

실제로 사용자 환경에 중요한 많은 필드 (예: 제목, 설명, 식별 정보)는 종종 indexable, searchable, retrievable로 설정됩니다.

제한사항

필드 설정에는 다음과 같은 제한사항이 있습니다.

  • 최대 50개의 필드를 색인 생성 가능, 검색 가능, 가져오기 가능 또는 동적 패싯 생성 가능으로 구성할 수 있습니다.
  • 필드를 동적 패싯 생성 가능으로 구성하려면 먼저 색인 생성 가능으로 구성해야 합니다.
  • 색인 생성 가능 설정을 변경하려면 데이터의 색인을 다시 생성해야 하므로 특히 대규모 데이터 스토어의 경우 몇 시간이 걸릴 수 있습니다.

미디어 검색 앱의 필드를 구성하는 경우 스키마의 필드에 대한 세부정보를 확인하려면 미디어 문서 및 데이터 스토어 정보를 참조하세요.

필드 설정 업데이트

필드 설정을 업데이트하려면 다음 단계를 따르세요.

  1. 콘솔에서 AI 애플리케이션 페이지로 이동합니다. Google Cloud

    AI Applications

  2. 수정하려는 앱의 이름을 클릭합니다.

  3. 데이터를 클릭합니다.

  4. 스키마 탭을 클릭합니다. 이 탭에는 현재 필드 설정이 표시됩니다.

    데이터 스토어에 기본 웹사이트 데이터 또는 메타데이터가 없는 비정형 데이터가 포함되어 있는 경우 스키마 탭이 표시되지 않습니다.

  5. 수정 을 클릭합니다.

  6. 업데이트해야 하는 필드 설정을 선택하거나 삭제합니다. 일부 필드 설정은 지원되지 않습니다. 예를 들어 숫자 필드는 검색 가능으로 설정할 수 없습니다.

  7. 저장 을 클릭하여 변경사항을 적용합니다.

필드를 검색 가능으로 표시하면 검색 결과에서 상대적 중요도를 나타내는 가중치를 지정할 수 있습니다. 대부분의 경우 기본 가중치가 잘 작동하므로 개별 필드의 가중치를 지정할 필요가 없습니다.

하지만 다음과 같은 몇 가지 상황에서는 가중치를 조정해야 할 수 있습니다.

  • 가중치가 적용된 필드를 이미 사용하는 기존 검색 플랫폼에서 데이터를 이전합니다.

  • 기본 가중치가 만족스러운 검색 결과를 제공하지 않는 경우 특히 검색 가능한 필드가 많고 일부 필드가 다른 필드보다 훨씬 더 중요한 경우에 발생할 수 있습니다.

    요약이 검색에 가장 중요한 필드이므로 해당 텍스트에 우선순위를 지정할 수 있습니다.

    또는 스키마에 검색 결과를 훌륭하게 예측하는 매우 관련성이 높은 키워드가 포함된 필드가 있지만 이 필드가 다른 필드보다 훨씬 짧기 때문에 영향력이 더 긴 필드에 의해 가려지는 경우가 많습니다. 가중치를 늘리면 의도한 영향을 미칠 수 있습니다.

가중치 수준

가중치는 다음 수준으로 분류됩니다.

필드 중요도 설명
매우 낮음 시스템에서 모든 필드의 점수를 결합할 때 여전히 고려하는 낮은 값입니다. 영향이 미미하도록 가중치를 더 낮추려면, 필드를 검색 가능으로 표시하지 마세요.
낮음 기본값보다 낮은 가중치입니다.
기본 검색 가능한 필드의 표준 가중치입니다. 이 가중치는 대부분의 경우에 적절한 성능을 제공합니다.
높음 기본값보다 눈에 띄게 높은 가중치입니다.
매우 높음 지배적인 가중치입니다. 일반적으로 이 가중치는 최대 하나의 필드에 예약합니다.

스키마 업데이트 및 색인 다시 생성

검색 가능한 필드에 가중치를 추가하려면 스키마 업데이트와 데이터 스토어의 데이터에 대한 후속 색인 다시 생성이 필요합니다. 스키마를 업데이트하는 데 몇 시간이 걸리며 색인 생성이 완료되는 시점을 알려주는 안정적인 표시기가 없으므로 색인 생성 시간을 과대평가해야 합니다.

필드에 가중치 수준 설정

필드의 가중치 수준을 설정하는 작업은 작은 변경사항만 적용하고 의도하지 않은 결과가 있는지 확인하기 위해 검색 결과를 신중하게 검토해야 하므로 지루할 수 있습니다. 각 변경 후에는 변경사항의 영향을 평가하기 전에 색인 다시 생성이 완료될 때까지 기다려야 합니다.

API를 통해서만 검색 필드 가중치를 구성할 수 있습니다. 콘솔에서는 이 기능을 사용할 수 없습니다. Google Cloud

가중치를 설정하려면 API projects.locations.dataStores.schemas.patch 메서드를 통해 데이터 스토어의 스키마를 업데이트해야 합니다.

  1. 스키마가 아직 없는 경우 스키마 정의 보기의 안내에 따라 스키마를 가져옵니다.

  2. 안내에 따라 스키마를 업데이트 프로그래매틱 방식으로 업데이트합니다. 다음 예와 같이 하나 이상의 검색 가능한 필드에 가중치를 추가합니다.

    "summary": {
       "type": "string",
       "searchable": true,
       "weight": "high"
     },
     "uri": {
       "type": "string",
       "searchable": true,
       "weight": "low"
     },
    

    이 예에서는 summary 필드가 일반 가중치보다 높은 가중치로 설정되고 uri 필드가 더 낮은 가중치로 설정됩니다. 가중치를 기본값으로 되돌리려면 default로 설정합니다.

    가중치 매개변수에 허용되는 값은 다음과 같습니다.

    • very_low
    • low
    • default
    • high
    • very_high
  3. 색인 다시 생성이 완료될 때까지 기다린 후 검색 행동을 테스트합니다.

다음 단계