벡터 검색 2.0은 자동 조정식의 완전 관리형 AI 네이티브 검색엔진으로 처음부터 설계된 Google Cloud 제품입니다. Google Cloud의 기존 벡터 검색은 강력한 근사 최근접 이웃(ANN) 서비스형 색인 시스템이지만 벡터 검색 2.0은 이 개념을 포괄적인 저장 및 검색 시스템으로 발전시킵니다. 기본 리소스로 인덱스를 관리하는 대신 데이터 객체의 컬렉션으로 작업하게 됩니다.
검색엔진 아키텍처는 확장 가능한 복제 스토리지 엔진을 제공하므로, 벡터 검색 2.0은 AI 애플리케이션을 위한 단일 통합 데이터 소스가 되며 보조 데이터 스토리지가 필요하지 않습니다.
이 새로운 아키텍처의 주요 이점은 다음과 같습니다.
개발자 친화적: 최소한의 코드가 필요한 직관적인 클라이언트 라이브러리로 빠르게 시작할 수 있습니다. 시스템은 높은 성능을 유지하도록 자동 조정되며 기본 인프라를 추상화하므로 VM이나 복제본을 구성할 필요가 없습니다.
빠른 온보딩 및 평가: 컬렉션을 만들고 데이터를 추가하여 빠르게 검색을 시작할 수 있습니다.
통합 데이터 스토리지: 벡터 유사성 및 페이로드 데이터를 기준으로 문서를 한곳에서 저장, 검색, 필터링합니다.
강력한 기능: 내장 모델을 사용하여 임베딩 필드를 자동으로 채우고, 풍부한 쿼리 기능으로 데이터를 탐색하고, 자체 임베딩을 가져오고(BYOE), 색인을 빠르게 만들어 성능을 확장합니다.
간소화된 가격 책정: 적응형 가격 책정에는 두 가지 모델이 있습니다. 소규모 워크로드의 경우 사용량 기반, 조정된 성능의 경우 리소스 기반입니다.
벡터 검색 2.0은 벡터 검색 1.0에서 제공되는 고성능 및 대규모 확장성이 유지되므로 원활하게 시작하고 확장할 수 있습니다.
개념
시작하기 전에 다음 벡터 검색 2.0 개념을 이해하면 도움이 됩니다.
컬렉션: 관련 JSON 객체 집합의 컨테이너입니다. 관계형 데이터베이스의 테이블과 유사합니다. 단일 데이터베이스 내에 여러 컬렉션을 만들 수 있습니다.
데이터 객체: 컬렉션 내에 저장된 개별 JSON 객체입니다.
컬렉션: 스키마: 컬렉션 내 데이터 객체의 구조와 제약 조건을 정의합니다. 엄격한 스키마 유효성 검사와 완화된 스키마 유효성 검사 모두에 대해 구성할 수 있습니다.
컬렉션 색인: 컬렉션 내 데이터 객체 전반에서 효율적인 근사 최근접 이웃(ANN) 검색을 지원합니다. 컬렉션에는 데이터 객체의 각 벡터 필드에 대한 색인과 같이 여러 색인이 있을 수 있습니다.
다음 단계
- 컬렉션을 만드는 방법을 알아보세요.