Vector Search 2.0

A Pesquisa vetorial 2.0 é um produto Google Cloud projetado do zero como um mecanismo de pesquisa nativo de IA, totalmente gerenciado e com ajuste automático. Embora a pesquisa vetorial atual do Google Cloudseja um sistema poderoso de índice como serviço de vizinho mais próximo aproximado (ANN), a pesquisa vetorial 2.0 evolui esse conceito para um sistema abrangente de armazenamento e recuperação. Em vez de gerenciar índices como o recurso principal, você vai trabalhar com coleções de objetos de dados.

A arquitetura do mecanismo de pesquisa oferece um mecanismo de armazenamento replicado e escalonável, tornando a pesquisa vetorial 2.0 uma única fonte de dados unificada para seus aplicativos de IA e eliminando a necessidade de armazenamento de dados auxiliar.

Os principais benefícios dessa nova arquitetura incluem:

  • Fácil para desenvolvedores:comece rapidamente com bibliotecas de cliente intuitivas que exigem pouco código. O sistema é ajustado automaticamente para manter o alto desempenho, abstraindo a infraestrutura subjacente para que você não precise configurar VMs ou réplicas.

  • Integração e avaliação rápidas:crie coleções, adicione seus dados e comece a pesquisar rapidamente.

  • Armazenamento unificado de dados:armazene, recupere e filtre seus documentos por similaridade vetorial e dados de payload, tudo em um só lugar.

  • Recursos avançados:preencha automaticamente os campos de incorporação usando modelos integrados, analise seus dados com recursos de consulta avançados, traga suas próprias incorporações (BYOE) e crie índices rapidamente para dimensionar a performance.

  • Preços simplificados:os preços adaptáveis têm dois modelos: com base no uso para cargas de trabalho menores e com base em recursos para desempenho ajustado.

A Pesquisa Vetorial 2.0 mantém o alto desempenho e a escalonabilidade massiva disponíveis na Pesquisa Vetorial 1.0, facilitando o início e o escalonamento.

Conceitos

Antes de começar, é útil entender os seguintes conceitos da Pesquisa Vetorial 2.0:

  • Coleção:um contêiner para um conjunto de objetos JSON relacionados. Isso é semelhante a uma tabela em um banco de dados relacional. É possível criar várias coleções em um único banco de dados.

  • Objeto de dados:um objeto JSON individual armazenado em uma coleção.

  • Coleção: esquema:define a estrutura e as restrições dos objetos de dados em uma coleção. Ele pode ser configurado para validações de esquema estritas e flexíveis.

  • Índice de coleção:permite uma pesquisa eficiente de vizinho mais próximo aproximado (ANN) em objetos de dados dentro de uma coleção. Uma coleção pode ter vários índices, como um para cada campo de vetor nos seus objetos de dados.

A seguir