Demo interattiva di Vector Search 2.0

Questa demo interattiva ti consente di esplorare Vector Search 2.0, il database vettoriale completamente gestito per Google Cloud. Utilizza la demo per eseguire ricerche in milioni di schede di prodotto con la ricerca semantica (basata sulla ricerca di testo per parole chiave con incorporamenti automatici di Gemini o sulla ricerca ibrida che utilizza Reciprocal Rank Fusion (RRF) per combinare la ricerca semantica e la ricerca di testo per parole chiave. I risultati possono essere riordinati utilizzando l'API di classificazione di Gemini Enterprise Agent Platform per il riordinamento.

Vantaggi di Vector Search 2.0

Vector Search richiedeva la generazione di incorporamenti separati, il deployment dell'indice e un Vertex AI Feature Store per i metadati. Vector Search 2.0 fornisce un'archiviazione unificata per dati e incorporamenti, la generazione automatica di incorporamenti e la ricerca di testo integrata senza richiedere la gestione dell'infrastruttura.

Prova

Per eseguire:

  1. Nel campo Query, descrivi gli elementi per cui vuoi eseguire la query (ad esempio, vintage 1970s pinball machine). In alternativa, fai clic su Genera query per generare automaticamente una descrizione.

  2. Fai clic su Invia o premi Invio.

Sperimenta le diverse opzioni della demo per iniziare a comprendere Vector Search 2.0 e le nozioni di base della tecnologia di ricerca vettoriale. Per ulteriori informazioni, vai a Interfaccia utente.

Interfaccia utente

Questa sezione descrive le impostazioni dell'interfaccia utente che puoi utilizzare per controllare i risultati restituiti da Vector Search 2.0 e la loro classificazione.

Set di dati

Utilizza il menu a discesa Set di dati per scegliere il set di dati su cui Vector Search 2.0 eseguirà la query. Per informazioni su ogni set di dati, vai a Set di dati.

Query

Per eseguire una query:

  1. Fai clic su Set di dati e scegli il set di dati su cui eseguire la query.

  2. Nel campo Query , aggiungi una descrizione, poni una domanda o inserisci una o più parole chiave per specificare gli elementi per cui Vector Search 2.0 deve restituire i risultati. In alternativa, fai clic su Genera query per generare automaticamente una query.

  3. Esegui una delle seguenti operazioni:

    1. Per restituire risultati semanticamente simili, seleziona Semantica.
    2. Per restituire risultati basati sulla sintassi del testo della query, seleziona Testo.
    3. Per eseguire una ricerca ibrida, seleziona sia Semantica che Testo.
  4. Se stai eseguendo una query semantica sul set di dati Mercari 3M items (128-dim Gemini text embeddings) o Mercari 3M items (768-dim Gemini text embeddings), fai clic su Query Task Type e seleziona QUESTION_ANSWERING o RETRIEVAL_QUERY.

  5. Fai clic su Invia o premi Invio per eseguire la query.

Modifica

Esistono molte opzioni che puoi utilizzare per modificare i risultati restituiti da Vector Search 2.0 da una query.

  • Fai clic su Righe e scegli il numero massimo di risultati di ricerca che vuoi che Vector Search 2.0 restituisca.

  • Seleziona Semantica per restituire risultati semanticamente simili.

  • Seleziona Testo per restituire risultati basati sulla sintassi del testo della query.

  • Seleziona sia Semantica che Testo per attivare la ricerca ibrida.

  • Seleziona Riordina per riordinare i risultati di ricerca in base alla loro pertinenza per la query. Per ulteriori informazioni, vedi Migliorare la qualità della ricerca e della RAG con l'API di classificazione.

  • Seleziona Usa kNN per utilizzare l'algoritmo k-Nearest Neighbor per recuperare i risultati di ricerca. Poiché kNN fornisce una percentuale di richiamo del 100%, è molto utile per il debug o il test.

  • Fai clic su Query Task Type e seleziona il tipo di attività di query da utilizzare. Questa opzione è disponibile solo quando utilizzi i set di dati Mercari 3M items (128-dim Gemini text embeddings) e Mercari 3M items (768-dim Gemini text embeddings). Per ulteriori informazioni sui tipi di attività di query, vai a Scegliere un tipo di attività di incorporamento.

  • Nel campo RRF Alpha , inserisci un valore compreso tra 0,0 e 1,0 per specificare l'effetto di classificazione RRF. Questa opzione è disponibile solo per la ricerca ibrida (sono selezionati sia Semantica che Testo).
    Valori alfa di:

    • 1.0 - Classifica i risultati in base alla somiglianza semantica (densa).
    • 0.0 - Classifica i risultati in base alla pertinenza delle parole chiave (sparse).
    • 0.5 - Classifica i risultati con un peso uguale per la somiglianza semantica (densa) e la pertinenza delle parole chiave (sparse).

    Per ulteriori informazioni, vedi Che cos'è Reciprocal Rank Fusion?

Metriche

Dopo l'esecuzione di una query, vengono fornite metriche di latenza che suddividono il tempo impiegato per il completamento delle diverse fasi della ricerca.

È incluso quanto segue:

  • La latenza totale da tutte le origini.
  • Il tempo impiegato per generare gli incorporamenti ed eseguire una ricerca vettoriale.
  • Il tempo impiegato per il riordinamento se è selezionato Riordina.
  • La latenza totale della rete e di altre origini.

Incorporamenti

Vector Search 2.0 supporta i seguenti tipi di incorporamento:

Procedura di query

In Vector Search 2.0, la procedura di query dipende dal tipo di ricerche eseguite e dai modelli di incorporamento.

La generazione e la ricerca di incorporamenti avvengono in una singola chiamata API. Vector Search 2.0 genera automaticamente l'incorporamento della query lato server utilizzando il modello specificato in vertex_embedding_config per la Collection, esegue la ricerca e restituisce i risultati con i metadati completi senza richiedere un recupero separato di Vertex AI Feature Store.

Word2Vec e multimodale

Il client genera l'incorporamento della query e lo invia a Vector Search 2.0 per la ricerca vettoriale. I risultati includono comunque i metadati completi della raccolta e non è necessario recuperare un Vertex AI Feature Store.

Testo

Vector Search 2.0 esegue direttamente la corrispondenza delle parole chiave integrate. Gli incorporamenti non vengono generati.

Set di dati

Set di dati Descrizione Modello di incorporamento Tipo di attività di incorporamento
Mercari 1M items
(768-dim Gemini text embeddings)
Utilizza il modello di incorporamento Gemini Embedding 2 con incorporamenti di testo e immagini separati. Questo set di dati supporta la ricerca da testo a testo e da testo a immagine utilizzando diversi campi vettoriali. gemini-embedding-2-preview SEMANTIC_SIMILARITY
Mercari 3M items
(128-dim Gemini text embeddings)
Ha un numero ridotto di dimensioni di incorporamento che fornisce una dimensione dell'indice e un costo di archiviazione inferiori. Questo set di dati potrebbe avere una precisione inferiore rispetto a Mercari 3M items (768-dim Gemini text embeddings). gemini-embedding-001 RETRIEVAL_DOCUMENT
Mercari 3M items
(768-dim Gemini text embeddings)
Dispone di incorporamenti a dimensione intera con incorporamenti automatici e un'elevata precisione semantica del testo. Questo set di dati utilizza RETRIEVAL_DOCUMENT per la corrispondenza asimmetrica tra query e documenti. gemini-embedding-001 RETRIEVAL_DOCUMENT
Mercari 3M items
(768-dim Gemini text embeddings, semantic similarity)
Utilizza il tipo di attività SEMANTIC_SIMILARITY per la corrispondenza di similarità. Questo set di dati è ideale per i casi d'uso che richiedono la funzionalità "trova articoli simili" in cui la query e i documenti hanno la stessa semantica. gemini-embedding-001 SEMANTIC_SIMILARITY
Mercari 3M items
(1408-dim Vertex AI multimodal embeddings)
Dispone di incorporamenti multimodali di Vertex AI che codificano le immagini degli articoli per la ricerca immagini. multimodal-embedding-001 N/D
Mercari 3M items
(100-dim Word2Vec text embeddings)
Utilizza il modello di incorporamento Gensim Word2Vec. Questo set di dati ha l'inferenza più rapida. Fornisce solo la comprensione semantica a livello di parola, ma è molto compatto. Gensim Word2Vec N/D

Vedi anche