Com esta demonstração interativa, você pode conhecer a Pesquisa vetorial 2.0, o banco de dados vetorial totalmente gerenciado para Google Cloud. Use a demonstração para pesquisar em milhões de informações de produtos com a pesquisa semântica (com tecnologia de embeddings automáticos do Gemini pesquisa de texto por palavra-chave ou pesquisa híbrida que usa a Fusão de classificação recíproca (RRF) para combinar a pesquisa semântica e a pesquisa de texto por palavra-chave. Os resultados podem ser reclassificados usando a API Ranking da plataforma de agentes do Gemini Enterprise.
Benefícios da pesquisa vetorial 2.0
A pesquisa vetorial exigia geração de embeddings separada, implantação de índice e uma Vertex AI Feature Store para metadados. A Pesquisa vetorial 2.0 oferece armazenamento unificado para dados e embeddings, geração automática de embeddings e pesquisa de texto integrada sem exigir que você gerencie a infraestrutura.
Testar
Para executar:
No campo Consulta, descreva os itens que você quer consultar (por exemplo,
vintage 1970s pinball machine). Ou clique em Gerar consulta para gerar uma descrição automaticamente.Clique em Enviar ou pressione Enter.
Teste as diferentes opções na demonstração para começar a entender a pesquisa vetorial 2.0 e os conceitos básicos da tecnologia de pesquisa vetorial. Para mais informações, acesse Interface do usuário.
Interface do usuário
Esta seção descreve as configurações na UI que você pode usar para controlar os resultados retornados pela pesquisa vetorial 2.0 e como eles são classificados.
Conjunto de dados
Use o menu suspenso Conjunto de dados para escolher em qual conjunto a Pesquisa de vetores 2.0 vai executar sua consulta. Para informações sobre cada conjunto de dados, acesse Conjuntos de dados.
Consulta
Para executar uma consulta:
Clique em Conjunto de dados e escolha em qual conjunto de dados executar a consulta.
No campo Consulta, adicione uma descrição, faça uma pergunta ou insira uma ou mais palavras-chave para especificar os itens que a Pesquisa vetorial 2.0 vai retornar. Ou clique em Gerar consulta para gerar uma consulta automaticamente.
Escolha uma destas opções:
- Para retornar resultados semanticamente semelhantes, selecione Semântico.
- Para retornar resultados com base na sintaxe de texto da consulta, selecione Texto.
- Para fazer uma pesquisa híbrida, selecione Semântica e Texto.
Se você estiver consultando semanticamente o conjunto de dados Mercari 3M items (128-dim Gemini text embeddings) ou Mercari 3M items (768-dim Gemini text embeddings), clique em Tipo de tarefa de consulta e selecione QUESTION_ANSWERING ou RETRIEVAL_QUERY.
Clique em Enviar ou pressione Enter para executar a consulta.
Modificar
Há muitas opções que você pode usar para modificar os resultados que a pesquisa vetorial 2.0 retorna de uma consulta.
Clique em Linhas e escolha o número máximo de resultados da pesquisa que você quer que a Pesquisa vetorial 2.0 retorne.
Selecione Semântica para retornar resultados semanticamente semelhantes.
Selecione Texto para retornar resultados com base na sintaxe de texto da sua consulta.
Selecione Semântica e Texto para ativar a pesquisa híbrida.
Selecione Reclassificar para reclassificar os resultados da pesquisa com base na relevância da consulta. Para mais informações, consulte Melhorar a pesquisa e a qualidade da RAG com a API Ranking.
Selecione Usar kNN para usar o algoritmo de vizinhos k-mais próximos e recuperar resultados da pesquisa. Como o kNN oferece uma taxa de recall de 100%, ele é muito útil ao depurar ou testar.
Clique em Tipo de tarefa de consulta e selecione o tipo de tarefa de consulta que você quer usar. Isso só está disponível ao usar os conjuntos de dados Mercari 3M items (128-dim Gemini text embeddings) e Mercari 3M items (768-dim Gemini text embeddings). Para mais informações sobre tipos de tarefas de consulta, acesse Escolher um tipo de tarefa de embeddings.
No campo Alfa do RRF, insira um valor entre 0,0 e 1,0 para especificar o efeito de classificação do RRF. Esse recurso está disponível apenas para pesquisa híbrida (Semântica e Texto selecionados). Valores alfa de
:1.0: classifica os resultados apenas por semelhança semântica (densa).0.0: classifica os resultados apenas por relevância de palavra-chave (esparsa).0.5: classifica os resultados com peso de requalificação dado à semelhança semântica (densa) e à relevância de palavras-chave (esparsa).
Para mais informações, consulte O que é a Fusão de classificação recíproca?
Métricas
Depois que uma consulta é executada, você recebe métricas de latência que detalham o tempo necessário para a conclusão de diferentes etapas da pesquisa.
Isso inclui:
- A latência total de todas as fontes.
- O tempo que levou para gerar embeddings e realizar uma pesquisa vetorial.
- O tempo que o reordenamento levou se Reordenar estiver selecionado.
- A quantidade total de latência da rede e de outras fontes.
Embeddings
A pesquisa vetorial 2.0 é compatível com os seguintes tipos de incorporação:
Multimodal:pesquisa semântica multimodal em imagens de itens. Para mais detalhes, acesse O que é a Pesquisa Multimodal: "LLMs com visão" mudam as empresas.
Texto (semelhança semântica): pesquisa semântica de texto em nomes e descrições de itens com base na semelhança semântica. Para saber mais, acesse Embeddings da Vertex AI para texto: embasamento de LLMs facilitado.
Texto (documento de recuperação): pesquisa assimétrica baseada em uma pergunta ou frase curta. Para saber mais, acesse Embeddings da Vertex AI para texto: embasamento de LLMs facilitado.
Palavra:compreensão semântica no nível da palavra com inferência muito rápida e altamente compacta.
Processo de consulta
Na pesquisa vetorial 2.0, o processo de consulta depende do tipo de pesquisa e dos modelos de incorporação.
Pesquisa semântica e híbrida
A geração e a pesquisa de embeddings acontecem em uma única chamada de API.
A Pesquisa vetorial 2.0 gera automaticamente o embedding de consulta no lado do servidor usando o modelo especificado no vertex_embedding_config para a Coleção, realiza a pesquisa e retorna resultados com metadados completos sem precisar de uma busca separada da Vertex AI Feature Store.
Word2Vec e multimodal
O cliente gera a embedding de consulta e a envia para a Pesquisa vetorial 2.0. Os resultados ainda incluem metadados completos da coleção, e não é necessário buscar na Vertex AI Feature Store.
Texto
A pesquisa vetorial 2.0 realiza a correspondência de palavras-chave integrada diretamente. Os embeddings não são gerados.
Conjuntos de dados
| Conjunto de dados | Descrição | Modelo de embedding | Tipo de tarefa de embedding |
|---|---|---|---|
| 1 milhão de itens do Mercari (incorporações de texto do Gemini de 768 dimensões) |
Usa o modelo de embedding Gemini Embedding 2 com embeddings de texto e imagem separados. Esse conjunto de dados é compatível com a pesquisa de texto para texto e a pesquisa de conversão de texto em imagem usando diferentes campos de vetor. | gemini-embedding-2-preview
|
SEMANTIC_SIMILARITY |
| 3 milhões de itens do Mercari (incorporações de texto do Gemini de 128 dimensões) |
Tem um número reduzido de dimensões de incorporação que oferece um tamanho de índice e um custo de armazenamento menores. Esse conjunto de dados pode ter menor acurácia do que os 3 milhões de itens do Mercari (incorporações de texto do Gemini de 768 dimensões). | gemini-embedding-001
|
RETRIEVAL_DOCUMENT |
| 3 milhões de itens do Mercari (incorporações de texto do Gemini de 768 dimensões) |
Tem embeddings de dimensão completa com embeddings automáticos e alta precisão semântica de texto. Esse conjunto de dados usa RETRIEVAL_DOCUMENT para correspondência assimétrica de consulta e documento. | gemini-embedding-001
|
RETRIEVAL_DOCUMENT |
| 3 milhões de itens do Mercari (embeddings de texto do Gemini de 768 dimensões, similaridade semântica) |
Usa o tipo de tarefa SEMANTIC_SIMILARITY para correspondência de similaridade. Esse conjunto de dados é o melhor para casos de uso que precisam da funcionalidade "encontrar itens semelhantes", em que a consulta e os documentos têm a mesma semântica. | gemini-embedding-001
|
SEMANTIC_SIMILARITY |
| 3 milhões de itens da Mercari (embeddings multimodais da Vertex AI de 1408 dimensões) |
Tem embeddings multimodais da Vertex AI que codificam imagens de itens para pesquisa por imagens. | multimodal-embedding-001
|
N/A |
| Mercari 3M items (incorporações de texto Word2Vec de 100 dimensões) |
Usa o modelo de embedding Word2Vec do Gensim. Esse conjunto de dados tem a inferência mais rápida. Ele oferece apenas compreensão semântica no nível da palavra, mas é muito compacto. | Gensim Word2Vec | N/A |