ベクトル検索 2.0 は、セルフチューニング型のフルマネージド AI ネイティブ検索エンジンとしてゼロから設計された Google Cloud プロダクトです。 Google Cloudの既存のベクトル検索は、パワフルな近似最近傍探索(ANN)インデックス サービス システムですが、ベクトル検索 2.0 では、このコンセプトが包括的なストレージと検索システムに進化しています。インデックスをプライマリ リソースとして管理するのではなく、データ オブジェクトのコレクションを操作します。
検索エンジン アーキテクチャは、複製されたスケーラブルなストレージ エンジンを提供します。これにより、Vector Search 2.0 は AI アプリケーションの単一の統合データソースとなり、補助データ ストレージの必要性がなくなります。
この新しいアーキテクチャの主なメリットは次のとおりです。
開発者向け: 最小限のコードで済む直感的なクライアント ライブラリを使用して、すぐに開始できます。システムは自動調整され、高いパフォーマンスを維持します。基盤となるインフラストラクチャが抽象化されるため、VM やレプリカを構成する必要はありません。
迅速なオンボーディングと評価: コレクションを作成し、データを追加して、すぐに検索を開始できます。
統合データ ストレージ: ベクトル類似度とペイロード データに基づいてドキュメントを保存、取得、フィルタリングできます。
優れた機能: 組み込みモデルを使用してエンベディング フィールドに自動的に入力して、豊富なクエリ機能でデータを探索し、独自のエンベディング(BYOE)を使い、インデックスを速やかに作成してパフォーマンスをスケーリングします。
料金の簡素化: 適応可能な料金には、小規模なワークロード向けの使用量ベースと、チューニングされたパフォーマンス向けの容量ベースの 2 つのモデルがあります。
Vector Search 2.0 は、Vector Search 1.0 で利用可能な高いパフォーマンスと大規模なスケーラビリティを維持しているため、シームレスに開始してスケーリングできます。
コンセプト
始める前に、次の Vector Search 2.0 のコンセプトを理解しておくと役立ちます。
コレクション: 関連する JSON オブジェクトのセットのコンテナ。これは、リレーショナル データベースのテーブルに似ています。1 つのデータベース内に複数のコレクションを作成できます。
データ オブジェクト: コレクション内に保存されている個々の JSON オブジェクト。
Collection: schema: Collection 内のデータ オブジェクトの構造と制約を定義します。厳格なスキーマ検証と緩和されたスキーマ検証の両方に構成できます。
コレクション インデックス: コレクション内のデータ オブジェクト全体で効率的な近似最近傍(ANN)検索を可能にします。コレクションには、データ オブジェクトの各ベクトル フィールドに対応するインデックスなど、複数のインデックスを設定できます。
次のステップ
- コレクションを作成する方法を確認する。