Vector Search 2.0

A pesquisa vetorial 2.0 é um Google Cloud produto concebido de raiz como um motor de pesquisa nativo de IA totalmente gerido e de ajuste automático. Embora a pesquisa vetorial existente seja um sistema de índice como serviço (IaaS) de vizinho mais próximo aproximado (ANN) avançado, a pesquisa vetorial 2.0 evolui este conceito para um sistema de armazenamento e obtenção abrangente. Google CloudEm vez de gerir os índices como o recurso principal, vai trabalhar com coleções de objetos de dados.

A arquitetura do motor de pesquisa oferece um motor de armazenamento replicado e escalável, o que torna a pesquisa vetorial 2.0 uma única origem de dados unificada para as suas aplicações de IA e elimina a necessidade de armazenamento de dados auxiliar.

As principais vantagens desta nova arquitetura incluem:

  • Fácil de usar para programadores: comece rapidamente com bibliotecas de cliente intuitivas que requerem um código mínimo. O sistema é ajustado automaticamente para manter um elevado desempenho, abstraindo a infraestrutura subjacente para que não tenha de configurar VMs nem réplicas.

  • Integração e avaliação rápidas: crie coleções, adicione os seus dados e comece a pesquisar rapidamente.

  • Armazenamento de dados unificado: armazene, obtenha e filtre os seus documentos por similaridade de vetores e dados de carga útil, tudo num único local.

  • Funcionalidades avançadas: preencha automaticamente os campos de incorporação com modelos incorporados, explore os seus dados com capacidades de consulta avançadas, use as suas próprias incorporações (BYOE) e crie rapidamente índices para dimensionar o desempenho.

  • Preços simplificados: os preços adaptáveis apresentam dois modelos: com base na utilização para cargas de trabalho mais pequenas e com base nos recursos para um desempenho otimizado.

A pesquisa vetorial 2.0 mantém o alto desempenho e a escalabilidade massiva disponíveis na pesquisa vetorial 1.0, o que facilita o início e a expansão.

Conceitos

Antes de começar, é útil compreender os seguintes conceitos da pesquisa vetorial 2.0:

  • Coleção: um contentor para um conjunto de objetos JSON relacionados. Isto é semelhante a uma tabela numa base de dados relacional. Pode criar muitas coleções numa única base de dados.

  • Objeto de dados: um objeto JSON individual armazenado numa coleção.

  • Coleção: esquema: define a estrutura e as restrições dos objetos de dados numa coleção. Pode ser configurado para validações de esquemas rigorosas e flexíveis.

  • Índice de coleções: permite uma pesquisa eficiente de vizinhos mais próximos aproximados (ANN) em objetos de dados numa coleção. Uma coleção pode ter vários índices, como um para cada campo de vetor nos seus objetos de dados.

O que se segue?