ベクトル検索 2.0

ベクトル検索 2.0 は、セルフチューニング型のフルマネージド AI ネイティブ検索エンジンとしてゼロから設計された Google Cloud プロダクトです。 Google Cloudの既存のベクトル検索は、パワフルな近似最近傍探索(ANN)インデックス サービス システムですが、ベクトル検索 2.0 では、このコンセプトが包括的なストレージと検索システムに進化しています。インデックスをプライマリ リソースとして管理するのではなく、データ オブジェクトのコレクションを操作します。

検索エンジン アーキテクチャは、複製されたスケーラブルなストレージ エンジンを提供します。これにより、Vector Search 2.0 は AI アプリケーションの単一の統合データソースとなり、補助データ ストレージの必要性がなくなります。

この新しいアーキテクチャの主なメリットは次のとおりです。

  • 開発者向け: 最小限のコードで済む直感的なクライアント ライブラリを使用して、すぐに開始できます。システムは自動調整され、高いパフォーマンスを維持します。基盤となるインフラストラクチャが抽象化されるため、VM やレプリカを構成する必要はありません。

  • 迅速なオンボーディングと評価: コレクションを作成し、データを追加して、すぐに検索を開始できます。

  • 統合データ ストレージ: ベクトル類似度とペイロード データに基づいてドキュメントを保存、取得、フィルタリングできます。

  • 優れた機能: 組み込みモデルを使用してエンベディング フィールドに自動的に入力して、豊富なクエリ機能でデータを探索し、独自のエンベディング(BYOE)を使い、インデックスを速やかに作成してパフォーマンスをスケーリングします。

  • 料金の簡素化: 適応可能な料金には、小規模なワークロード向けの使用量ベースと、チューニングされたパフォーマンス向けの容量ベースの 2 つのモデルがあります。

Vector Search 2.0 は、Vector Search 1.0 で利用可能な高いパフォーマンスと大規模なスケーラビリティを維持しているため、シームレスに開始してスケーリングできます。

コンセプト

始める前に、次の Vector Search 2.0 のコンセプトを理解しておくと役立ちます。

  • コレクション: 関連する JSON オブジェクトのセットのコンテナ。これは、リレーショナル データベースのテーブルに似ています。1 つのデータベース内に複数のコレクションを作成できます。

  • データ オブジェクト: コレクション内に保存されている個々の JSON オブジェクト。

  • Collection: schema: Collection 内のデータ オブジェクトの構造と制約を定義します。厳格なスキーマ検証と緩和されたスキーマ検証の両方に構成できます。

  • コレクション インデックス: コレクション内のデータ オブジェクト全体で効率的な近似最近傍(ANN)検索を可能にします。コレクションには、データ オブジェクトの各ベクトル フィールドに対応するインデックスなど、複数のインデックスを設定できます。

次のステップ