벡터 검색 2.0 대화형 데모

이 대화형 데모를 통해 벡터 검색 2.0을 살펴볼 수 있습니다. 완전 관리형 벡터 데이터베이스인 Google Cloud 데모를 사용하여 시맨틱 검색 (Gemini 자동 임베딩 키워드 텍스트 검색 또는 상호 순위 융합 (RRF) 을 사용하여 시맨틱 검색과 키워드 텍스트 검색을 결합하는 하이브리드 검색으로 수백만 개의 제품 목록을 검색합니다. 결과는 재정렬에 Gemini Enterprise Agent Platform Ranking API를 사용하는 재정렬될 수 있습니다.

벡터 검색 2.0의 이점

벡터 검색에는 별도의 임베딩 생성, 색인 배포, 메타데이터용 Vertex AI Feature Store가 필요했습니다. 벡터 검색 2.0은 인프라를 관리할 필요 없이 데이터 및 임베딩을 위한 통합 스토리지, 자동 임베딩 생성, 기본 제공 텍스트 검색을 제공합니다.

기능을 사용해 보세요.

안내에 따라 다음을 실행하세요.

  1. 검색어 필드에서 쿼리하려는 항목을 설명합니다(예: vintage 1970s pinball machine). 또는 쿼리 생성 을 클릭하여 설명을 자동으로 생성합니다.

  2. 제출 을 클릭하거나 Enter 키를 누릅니다.

데모에서 여러 옵션으로 실험하여 벡터 검색 2.0과 벡터 검색 기술의 기본 사항을 빠르게 이해하세요. 자세한 내용은 사용자 인터페이스를 참조하세요.

사용자 인터페이스

이 섹션에서는 UI에서 벡터 검색 2.0으로 반환되는 결과를 제어하기 위해 사용할 수 있는 설정과 결과 순위가 지정되는 방법을 설명합니다.

데이터 세트

데이터 세트 드롭다운을 사용하여 벡터 검색 2.0으로 쿼리를 실행할 데이터 세트를 선택합니다. 각 데이터 세트에 대한 자세한 내용은 데이터 세트를 참조하세요.

쿼리

쿼리를 실행하려면 다음 단계를 따르세요.

  1. 데이터 세트 를 클릭하고 쿼리를 실행할 데이터 세트를 선택합니다.

  2. 검색어 필드에 설명을 추가하거나, 질문을 하거나, 하나 이상의 키워드를 입력하여 벡터 검색 2.0이 결과를 반환할 항목을 지정합니다. 또는 쿼리 생성 을 클릭하여 쿼리를 자동으로 생성합니다.

  3. 다음 중 하나를 수행합니다.

    1. 시맨틱 유사성이 있는 결과를 반환하려면 시맨틱 을 선택합니다.
    2. 쿼리의 텍스트 구문을 기반으로 결과를 반환하려면 텍스트 를 선택합니다.
    3. 하이브리드 검색을 실행하려면 시맨틱텍스트 를 모두 선택합니다.
  4. Mercari 3M 항목 (128차원 Gemini 텍스트 임베딩) 또는 Mercari 3M 항목 (768차원 Gemini 텍스트 임베딩) 데이터 세트를 시맨틱으로 쿼리하는 경우 쿼리 태스크 유형 을 클릭하고 QUESTION_ANSWERING 또는 RETRIEVAL_QUERY 를 선택합니다.

  5. 제출 을 클릭하거나 Enter 키를 눌러 쿼리를 실행합니다.

수정

다양한 옵션을 사용하여 벡터 검색 2.0이 쿼리에서 반환하는 결과를 수정할 수 있습니다.

  • 을 클릭하고 벡터 검색 2.0으로 반환하려는 최대 검색 결과 수를 선택합니다.

  • 시맨틱 유사성이 있는 결과를 반환하려면 시맨틱 을 선택합니다.

  • 쿼리의 텍스트 구문을 기반으로 결과를 반환하려면 텍스트 를 선택합니다.

  • 하이브리드 검색을 사용 설정하려면 시맨틱텍스트 를 모두 선택합니다.

  • 검색 결과의 쿼리 관련성을 기반으로 검색 결과를 재정렬하려면 재정렬 을 선택합니다. 자세한 내용은 Ranking API로 검색 및 RAG 품질 개선을 참조하세요.

  • 검색 결과를 가져오려면 k-최근접 이웃 알고리즘 을 사용하려면 kNN 사용을 선택합니다. kNN은 100% 재현율을 제공하므로 디버깅 또는 테스트 시 매우 유용합니다.

  • 쿼리 태스크 유형 을 클릭하고 사용할 쿼리 태스크 유형을 선택합니다. 이 옵션은 Mercari 3M 항목 (128차원 Gemini 텍스트 임베딩)Mercari 3M 항목 (768차원 Gemini 텍스트 임베딩) 데이터 세트를 사용하는 경우에만 사용할 수 있습니다. 쿼리 태스크 유형에 대한 자세한 내용은 임베딩 태스크 유형 선택을 참조하세요.

  • RRF 알파 필드에 0.0~1.0 사이의 값을 입력하여 RRF 순위 효과를 지정합니다. 이 옵션은 하이브리드 검색 (시맨틱텍스트가 모두 선택됨)에만 사용할 수 있습니다.
    알파 값:

    • 1.0 - 시맨틱 (밀집) 유사성으로만 결과를 순위 지정합니다.
    • 0.0 - 키워드 (희소) 관련성으로만 결과를 순위 지정합니다.
    • 0.5 - 시맨틱 (밀집) 유사성과 키워드 (희소) 관련성에 동일한 가중치를 부여하여 결과를 순위 지정합니다.

    자세한 내용은 상호 순위 융합이란 무엇인가요?를 참조하세요.

측정항목

쿼리 실행 후에는 여러 검색 단계에 걸린 시간을 세분화하는 지연 시간 측정항목이 제공됩니다.

여기에는 다음이 포함됩니다.

  • 모든 소스의 총 지연 시간입니다.
  • 임베딩을 생성하고 벡터 검색을 실행하는 데 걸린 시간입니다.
  • 재정렬 을 선택한 경우 재정렬에 걸린 시간입니다.
  • 네트워크 및 기타 소스의 총 지연 시간입니다.

임베딩

벡터 검색 2.0은 다음 임베딩 유형을 지원합니다.

쿼리 프로세스

벡터 검색 2.0에서 쿼리 프로세스는 수행되는 검색 종류와 임베딩 모델에 따라 다릅니다.

임베딩 생성 및 검색은 단일 API 호출에서 이루어집니다. 벡터 검색 2.0은 별도의 Vertex AI Feature Store 가져오기가 필요 없이 컬렉션의 vertex_embedding_config에 지정된 모델을 사용하여 서버 측에서 쿼리 임베딩을 자동 생성하고, 검색을 실행하고, 전체 메타데이터와 함께 결과를 반환합니다.

Word2Vec 및 멀티모달

클라이언트는 쿼리 임베딩을 생성하고 벡터 검색을 위해 벡터 검색 2.0으로 전송합니다. 결과에는 여전히 컬렉션의 전체 메타데이터가 포함되며 Vertex AI Feature Store 가져오기가 필요하지 않습니다.

텍스트

벡터 검색 2.0은 기본 제공 키워드 검색 유형을 직접 실행합니다. 임베딩이 생성되지 않습니다.

데이터 세트

데이터 세트 설명 임베딩 모델 임베딩 태스크 유형
Mercari 1M 항목
(768차원 Gemini 텍스트 임베딩)
별도의 텍스트 및 이미지 임베딩과 함께 Gemini Embedding 2 임베딩 모델을 사용합니다. 이 데이터 세트는 다양한 벡터 필드를 사용하여 텍스트-텍스트 및 텍스트-이미지 검색을 지원합니다. gemini-embedding-2-preview SEMANTIC_SIMILARITY
Mercari 3M 항목
(128차원 Gemini 텍스트 임베딩)
임베딩 차원 수가 줄어들어 색인 크기와 스토리지 비용이 줄어듭니다. 이 데이터 세트는 Mercari 3M 항목 (768차원 Gemini 텍스트 임베딩)보다 정확도가 낮을 수 있습니다. gemini-embedding-001 RETRIEVAL_DOCUMENT
Mercari 3M 항목
(768차원 Gemini 텍스트 임베딩)
자동 임베딩과 높은 텍스트 시맨틱 정확도를 갖춘 전체 차원 임베딩이 있습니다. 이 데이터 세트는 비대칭 쿼리-문서 일치에 RETRIEVAL_DOCUMENT를 사용합니다. gemini-embedding-001 RETRIEVAL_DOCUMENT
Mercari 3M 항목
(768차원 Gemini 텍스트 임베딩, 시맨틱 유사성)
유사성 일치에 SEMANTIC_SIMILARITY 태스크 유형을 사용합니다. 이 데이터 세트는 쿼리와 문서의 시맨틱이 동일한 '유사한 항목 찾기' 기능이 필요한 사용 사례에 가장 적합합니다. gemini-embedding-001 SEMANTIC_SIMILARITY
Mercari 3M 항목
(1408차원 Vertex AI 멀티모달 임베딩)
이미지 검색을 위해 항목 이미지를 인코딩하는 Vertex AI 멀티모달 임베딩이 있습니다. multimodal-embedding-001 해당 사항 없음
Mercari 3M 항목
(100차원 Word2Vec 텍스트 임베딩)
Gensim Word2Vec 임베딩 모델을 사용합니다. 이 데이터 세트는 추론 속도가 가장 빠릅니다. 단어 수준의 시맨틱 이해만 제공하지만 매우 간결합니다. Gensim Word2Vec 해당 사항 없음

추가 정보