Vector Search è un potente motore di ricerca vettoriale basato su una tecnologia all'avanguardia sviluppata da Google Research. Sfruttando l'algoritmo ScaNN, Vector Search ti consente di creare sistemi di ricerca e suggerimenti di nuova generazione, nonché applicazioni di AI generativa.
Puoi usufruire della stessa ricerca e tecnologia alla base dei prodotti Google principali, tra cui la Ricerca Google, YouTube e Google Play. Ciò significa che ottieni la scalabilità, la disponibilità e le prestazioni affidabili per gestire enormi set di dati e fornire risultati rapidissimi su scala globale. Con la ricerca vettoriale, hai una soluzione di livello aziendale per implementare funzionalità di ricerca semantica all'avanguardia nelle tue applicazioni.
![]() |
![]() |
![]() Infinite Fleurs: scopri la creatività assistita dall'AI in piena fioritura |
![]() |
Inizia
Demo interattiva della ricerca vettoriale: prova la demo dal vivo per un esempio realistico di ciò che la tecnologia di ricerca vettoriale può fare e inizia subito a utilizzare la ricerca vettoriale.
Guida rapida di Ricerca vettoriale: prova Ricerca vettoriale in 30 minuti creando, eseguendo il deployment ed eseguendo query su un indice di Ricerca vettoriale utilizzando un set di dati di esempio. Questo tutorial tratta la configurazione, la preparazione dei dati, la creazione dell'indice, il deployment, l'esecuzione di query e la pulizia.
Prima di iniziare: prepara gli incorporamenti scegliendo e addestrando un modello e preparando i dati. Poi, scegli un endpoint pubblico o privato in cui eseguire il deployment dell'indice di query.
Prezzi di Vector Search e Calcolatore prezzi: i prezzi di Vector Search includono il costo delle macchine virtuali utilizzate per ospitare gli indici di cui è stato eseguito il deployment, nonché le spese per la creazione e l'aggiornamento degli indici. Anche una configurazione minima (meno di 100 $al mese) può gestire un'elevata velocità effettiva per casi d'uso di dimensioni moderate. Per stimare i costi mensili:
- Vai al Calcolatore prezzi di Google Cloud.
- Fai clic su Aggiungi alla stima.
- Cerca Vertex AI.
- Fai clic sul pulsante Vertex AI.
- Scegli Vertex AI Vector Search dal menu a discesa Tipo di servizio.
- Mantieni le impostazioni predefinite o configura le tue. Il costo mensile stimato è indicato nel riquadro Dettagli sui costi.
Documentazione
Casi d'uso e blog
La tecnologia di ricerca vettoriale sta diventando un hub centrale per le aziende che utilizzano l'AI. In modo simile al funzionamento dei database relazionali nei sistemi IT, collega vari elementi aziendali come documenti, contenuti, prodotti, utenti, eventi e altre entità in base alla loro pertinenza. Oltre a cercare contenuti multimediali convenzionali come documenti e immagini, la ricerca vettoriale può anche fornire consigli intelligenti, abbinare problemi aziendali a soluzioni e persino collegare segnali IoT ad avvisi di monitoraggio. È uno strumento versatile essenziale per orientarsi nel panorama in continua crescita dei dati aziendali basati sull'AI.
Ricerca / Recupero di informazioni Consiglio |
In che modo la ricerca vettoriale di Vertex AI aiuta a sbloccare app di AI generativa ad alte prestazioni: Vector Search alimenta diverse applicazioni, tra cui e-commerce, sistemi RAG e motori di suggerimenti, oltre a chatbot, ricerca multimodale e altro ancora. La ricerca ibrida migliora ulteriormente i risultati per i termini di nicchia. Clienti come Bloomreach, eBay e Mercado Libre utilizzano Vertex AI per le sue prestazioni, scalabilità ed efficacia in termini di costi, ottenendo vantaggi come una ricerca più rapida e un aumento delle conversioni. eBay utilizza la ricerca vettoriale per i suggerimenti: evidenzia in che modo eBay utilizza la ricerca vettoriale per il suo sistema di suggerimenti. Questa tecnologia consente a eBay di trovare prodotti simili all'interno del suo vasto catalogo, migliorando l'esperienza utente. Mercari sfrutta la tecnologia di ricerca vettoriale di Google per creare un nuovo marketplace: spiega come Mercari utilizza la ricerca vettoriale per migliorare la sua nuova piattaforma di marketplace. La ricerca vettoriale potenzia i suggerimenti della piattaforma, aiutando gli utenti a trovare i prodotti pertinenti in modo più efficace. Vertex AI Embeddings for Text: Grounding LLMs made easy: Si concentra sul grounding degli LLM utilizzando Vertex AI Embeddings per i dati di testo. Vector Search svolge un ruolo importante nella ricerca di passaggi di testo pertinenti che garantiscono che le risposte del modello si basino su informazioni oggettive. Che cos'è la ricerca multimodale: "LLM con visione" cambiano le attività: Descrive la ricerca multimodale, che combina i LLM con la comprensione visiva. Spiega come Vector Search elabora e confronta i dati di testo e immagine, consentendo esperienze di ricerca più complete. Sfrutta la ricerca multimodale su larga scala: combina la potenza di testo e immagini con Vertex AI: Descrive la creazione di un motore di ricerca multimodale con Vertex AI che combina la ricerca di testo e immagini utilizzando un metodo di ensemble Rank-Biased Reciprocal Rank ponderato. Ciò migliora l'esperienza utente e fornisce risultati più pertinenti. Scalare il recupero profondo con TensorFlow Recommenders e Ricerca vettoriale: spiega come creare un sistema di suggerimenti per le playlist utilizzando TensorFlow Recommenders e Ricerca vettoriale, trattando modelli di recupero profondo, addestramento, deployment e scalabilità. |
AI generativa: recupero per RAG e agenti |
Vertex AI e Denodo sbloccano i dati aziendali con l'AI generativa: mostra come l'integrazione di Vertex AI con Denodo consente alle aziende di utilizzare l'AI generativa per ottenere approfondimenti dai propri dati. Vector Search è fondamentale per accedere e analizzare in modo efficiente i dati pertinenti all'interno di un ambiente aziendale. Infinite Nature e la natura dei settori: questa demo "selvaggia" mostra le diverse possibilità dell'AI: Mostra una demo che illustra il potenziale dell'AI in diversi settori. Utilizza la ricerca vettoriale per fornire consigli generativi e la ricerca semantica multimodale. Infinite Fleurs: scopri la creatività assistita dall'AI in piena fioritura: Infinite Fleurs di Google, un esperimento di AI che utilizza la ricerca vettoriale, i modelli Gemini e Imagen, genera bouquet di fiori unici in base ai prompt degli utenti. Questa tecnologia mostra il potenziale dell'AI di ispirare la creatività in vari settori. LlamaIndex per RAG su Google Cloud: Descrive come utilizzare LlamaIndex per facilitare la Retrieval Augmented Generation (RAG) con modelli linguistici di grandi dimensioni. LlamaIndex utilizza la ricerca vettoriale per recuperare informazioni pertinenti da una knowledge base, con il risultato di risposte più accurate e contestualmente appropriate. RAG e grounding su Vertex AI: Esamina le tecniche di RAG e grounding su Vertex AI. La ricerca vettoriale aiuta a identificare informazioni di base pertinenti durante il recupero, il che rende i contenuti generati più accurati e affidabili. Vector Search su LangChain: fornisce una guida all'utilizzo di Vector Search con LangChain per creare e implementare un indice di database vettoriale per i dati di testo, inclusi domande e risposte ed elaborazione di PDF. |
BI, analisi dei dati, monitoraggio e altro ancora |
Attivazione dell'AI in tempo reale con l'importazione di flussi in Vertex AI: esplora l'aggiornamento di flussi nella ricerca vettoriale e come fornisce funzionalità di AI in tempo reale. Questa tecnologia consente l'elaborazione e l'analisi in tempo reale dei flussi di dati in entrata. |
Risorse correlate
Puoi utilizzare le seguenti risorse per iniziare a utilizzare la ricerca vettoriale:
- Notebook e soluzioni
- Tutorial e formazione
- Prodotti correlati
- Materiale di approfondimento dettagliato
Notebooks e soluzioni
![]() |
![]() |
Guida rapida di Vertex AI Vector Search: fornisce una panoramica della ricerca vettoriale. È progettato per gli utenti che non hanno familiarità con la piattaforma e vogliono iniziare rapidamente. |
Guida introduttiva agli embedding di testo e alla ricerca vettoriale: Introduce gli embedding di testo e la ricerca vettoriale. Spiega come funzionano queste tecnologie e come possono essere utilizzate per migliorare i risultati di ricerca. |
![]() |
![]() |
Combinazione di ricerca semantica e per parole chiave: un tutorial sulla ricerca ibrida con Vertex AI Vector Search: Fornisce istruzioni su come utilizzare Vector Search per la ricerca ibrida. Descrive i passaggi necessari per configurare un sistema di ricerca ibrido. |
Vertex AI RAG Engine con Vector Search: Esplora l'utilizzo di Vertex AI RAG Engine con Vector Search. Vengono illustrati i vantaggi dell'utilizzo congiunto di queste due tecnologie e vengono forniti esempi di come possono essere utilizzate in applicazioni reali. |
![]() |
![]() |
Infrastruttura per un'applicazione di AI generativa compatibile con RAG utilizzando Vertex AI e Vector Search: descrive in dettaglio l'architettura per la creazione di un'applicazione di AI generativa e RAG utilizzando Vector Search, Cloud Run e Cloud Storage, trattando casi d'uso, scelte di progettazione e considerazioni chiave. |
Implementa il recupero a due torri per la generazione di candidati su larga scala: fornisce un'architettura di riferimento che mostra come implementare un workflow di generazione di candidati a due torri end-to-end con Vertex AI. Il framework di modellazione a due torri è una potente tecnica di recupero per i casi d'uso di personalizzazione perché apprende la somiglianza semantica tra due entità diverse, come query web e elementi candidati. |
Formazione
Inizia a utilizzare Ricerca vettoriale e gli incorporamenti Ricerca vettoriale viene utilizzata per trovare elementi simili o correlati. Può essere utilizzato per consigli, ricerche, chatbot e classificazione del testo. La procedura prevede la creazione di incorporamenti, il loro caricamento su Google Cloude l'indicizzazione per le query. Questo lab si concentra sugli incorporamenti di testo utilizzando Vertex AI, ma gli incorporamenti possono essere generati per altri tipi di dati.
Ricerca vettoriale ed embedding Questo corso introduce la ricerca vettoriale e descrive come può essere utilizzata per creare un'applicazione di ricerca con API per modelli linguistici di grandi dimensioni (LLM) per gli embedding. Il corso è composto da lezioni teoriche su Vector Search e sugli embedding di testo, demo pratiche su come creare Vector Search su Vertex AI e un lab pratico.
Comprensione e applicazione dei text embedding
L'API Vertex AI Embeddings genera text embedding, ovvero
rappresentazioni numeriche del testo utilizzate per attività come l'identificazione di elementi simili.
In questo corso utilizzerai gli incorporamenti di testo per attività come la classificazione e la ricerca semantica e combinerai la ricerca semantica con i LLM per creare sistemi di domande e risposte utilizzando Vertex AI.
Machine Learning Crash Course: Embeddings Questo corso introduce le rappresentazioni distribuite di parole, mettendole a confronto con le rappresentazioni sparse. Esplora i metodi per ottenere gli embedding e distingue tra embedding statici e contestuali.
Prodotti correlati
Vertex AI Embeddings Fornisce una panoramica dell'API Embeddings. Casi d'uso di incorporamento multimodale e di testo, insieme a link a risorse aggiuntive e servizi Google Cloud correlati.
API Vertex AI Search Ranking L'API di ranking riordina i documenti in base alla pertinenza di una query utilizzando un modello linguistico preaddestrato, fornendo punteggi precisi. È ideale per migliorare i risultati di ricerca da varie fonti, inclusa la ricerca vettoriale.
Vertex AI Feature Store Consente di gestire e pubblicare i dati delle funzionalità utilizzando BigQuery come origine dati. Esegue il provisioning delle risorse per la distribuzione online, fungendo da livello di metadati per distribuire gli ultimi valori delle caratteristiche direttamente da BigQuery. Feature Store consente il recupero immediato dei valori delle caratteristiche per gli elementi restituiti da Vector Store per le query.
Vertex AI Pipelines Vertex AI Pipelines consente l'automazione, il monitoraggio e la governance dei tuoi sistemi ML in modo serverless orchestrando i flussi di lavoro ML con le pipeline ML. Puoi eseguire in batch le pipeline di ML definite utilizzando Kubeflow Pipelines o il framework TensorFlow Extended (TFX). Pipelines consente di creare pipeline automatizzate per generare incorporamenti, creare e aggiornare gli indici di ricerca vettoriale e formare una configurazione MLOps per la ricerca e i sistemi di raccomandazione di produzione.
Risorse per l'approfondimento
Migliorare il caso d'uso dell'AI generativa con gli incorporamenti e i tipi di attività di Vertex AI Si concentra sul miglioramento delle applicazioni di AI generativa utilizzando gli incorporamenti e i tipi di attività di Vertex AI. La ricerca vettoriale può essere utilizzata con gli incorporamenti del tipo di attività per migliorare il contesto e l'accuratezza dei contenuti generati trovando informazioni più pertinenti.
TensorFlow Recommenders Una libreria open source per la creazione di sistemi di suggerimenti. Semplifica il processo dalla preparazione dei dati al deployment e supporta la creazione flessibile di modelli. TFRS offre tutorial e risorse e consente la creazione di modelli di suggerimenti sofisticati.
TensorFlow Ranking TensorFlow Ranking è una libreria open source per la creazione di modelli di apprendimento neurale per il ranking (LTR) scalabili. Supporta varie funzioni di perdita e metriche di ranking, con applicazioni in ricerca, consigli e altri campi. La libreria è sviluppata attivamente da Google AI.
Annuncio di ScaNN: ricerca efficiente della similarità vettoriale ScaNN di Google, un algoritmo per la ricerca efficiente della similarità vettoriale, utilizza una nuova tecnica per migliorare l'accuratezza e la velocità nella ricerca dei vicini più prossimi. Supera i metodi esistenti e ha ampie applicazioni nelle attività di machine learning che richiedono la ricerca semantica. Gli sforzi di ricerca di Google riguardano varie aree, tra cui l'ML di base e gli impatti sociali dell'AI.
SOAR: nuovi algoritmi per una ricerca vettoriale ancora più veloce con ScaNN L'algoritmo SOAR di Google migliora l'efficienza della ricerca vettoriale introducendo una ridondanza controllata, consentendo ricerche più veloci con indici più piccoli. SOAR assegna vettori a più cluster, creando percorsi di ricerca "di backup" per migliorare il rendimento.
Video correlati
Inizia a utilizzare Ricerca vettoriale con Vertex AI
La ricerca vettoriale è uno strumento potente per creare applicazioni basate sull'AI. Questo video introduce la tecnologia e fornisce una guida passo passo per iniziare.
Scopri la ricerca ibrida con la ricerca vettoriale
La ricerca vettoriale può essere utilizzata per la ricerca ibrida, consentendoti di combinare la potenza della ricerca vettoriale con la flessibilità e la velocità di un motore di ricerca convenzionale. Questo video introduce la ricerca ibrida e mostra come utilizzare Vector Search per la ricerca ibrida.
Stai già utilizzando Vector Search. Ecco come diventare un esperto
Sapevi che probabilmente utilizzi la ricerca vettoriale ogni giorno senza rendertene conto? Dalla ricerca di quel prodotto sfuggente sui social media alla ricerca di una canzone che ti è rimasta in testa, la ricerca vettoriale è la magia dell'AI dietro queste esperienze quotidiane.
Il nuovo embedding "tipo di attività" del team DeepMind migliora la qualità della ricerca RAG
Migliora l'accuratezza e la pertinenza dei tuoi sistemi RAG con i nuovi incorporamenti del tipo di attività sviluppati dal team di Google DeepMind. Guarda il video e scopri le sfide comuni nella qualità della ricerca RAG e come gli incorporamenti del tipo di attività possono colmare efficacemente il divario semantico tra domande e risposte, portando a un recupero più efficace e a un miglioramento delle prestazioni di RAG.
Terminologia della ricerca vettoriale
Questo elenco contiene alcuni termini importanti che devi comprendere per utilizzare la ricerca vettoriale:
Vettore: un vettore è un elenco di valori float con grandezza e direzione. Può essere utilizzato per rappresentare qualsiasi tipo di dati, come numeri, punti nello spazio e indicazioni.
Incorporamento: un incorporamento è un tipo di vettore utilizzato per rappresentare i dati in modo da acquisirne il significato semantico. Gli incorporamenti vengono in genere creati utilizzando tecniche di machine learning e vengono spesso utilizzati nell'elaborazione del linguaggio naturale (NLP) e in altre applicazioni di machine learning.
Incorporamenti densi: gli incorporamenti densi rappresentano il significato semantico del testo, utilizzando array che contengono principalmente valori diversi da zero. Con gli incorporamenti densi, è possibile restituire risultati di ricerca simili in base alla somiglianza semantica.
Incorporamenti sparsi: gli incorporamenti sparsi rappresentano la sintassi del testo utilizzando array di grandi dimensioni che contengono pochissimi valori diversi da zero rispetto agli incorporamenti densi. Gli incorporamenti sparsi vengono spesso utilizzati per le ricerche di parole chiave.
Ricerca ibrida: la ricerca ibrida utilizza incorporamenti densi e sparsi, il che consente di eseguire ricerche in base a una combinazione di ricerca per parole chiave e ricerca semantica. Vector Search supporta la ricerca basata su embedding densi, embedding sparsi e ricerca ibrida.
Indice: una raccolta di vettori implementati insieme per la ricerca di somiglianza. I vettori possono essere aggiunti o rimossi da un indice. Le query di ricerca di somiglianze vengono inviate a un indice specifico e cercano i vettori in quell'indice.
Dati di fatto: un termine che si riferisce alla verifica dell'accuratezza del machine learning rispetto al mondo reale, ad esempio un set di dati di fatto.
Richiamo: la percentuale di vicini più vicini restituiti dall'indice che sono effettivamente i vicini più vicini. Ad esempio, se una query per i vicini più prossimi per 20 vicini più prossimi ha restituito 19 dei vicini più prossimi della verità di base, il richiamo è 19/20 x 100 = 95%.
Limitare: funzionalità che limita le ricerche a un sottoinsieme dell'indice utilizzando regole booleane. La limitazione è anche chiamata "filtraggio". Con la ricerca vettoriale, puoi utilizzare il filtro numerico e il filtro degli attributi di testo.