Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Recupero agente (in precedenza Vector Search 2.0)

Agent Retrieval (in precedenza Vector Search 2.0) è un Google Cloud prodotto progettato da zero come motore di ricerca AI-native, completamente gestito e con ottimizzazione automatica. Sebbene Google Cloud's Vector Search esistente sia un potente sistema di indice-as-a-service di ricerca del vicino più prossimo approssimato (ANN) , Agent Retrieval evolve questo concetto in un sistema completo di archiviazione e recupero. Anziché gestire gli indici come risorsa principale, lavorerai con raccolte di oggetti di dati.

L'architettura del motore di ricerca fornisce un motore di archiviazione replicato e scalabile, rendendo Agent Retrieval un'unica origine dati unificata per le tue applicazioni AI ed eliminando la necessità di spazio di archiviazione dati ausiliario.

Questi sono alcuni dei principali vantaggi:

Facile da usare per gli sviluppatori: inizia rapidamente a utilizzare librerie client intuitive che richiedono un codice minimo. Il sistema è ottimizzato automaticamente per mantenere prestazioni elevate, astrarre l'infrastruttura sottostante in modo da non dover configurare VM o repliche.
Onboarding e valutazione rapidi: crea raccolte, aggiungi i dati e inizia a cercare rapidamente.
Archiviazione dati unificata: archivia, recupera e filtra i documenti in base alla somiglianza vettoriale e ai dati del payload, tutto in un unico posto.
Funzionalità avanzate: popola automaticamente i campi di embedding utilizzando i modelli integrati, esplora i dati con funzionalità di query avanzate, porta i tuoi embedding (BYOE) e crea rapidamente indici per scalare le prestazioni.
Prezzi semplificati: i prezzi adattabili offrono due modelli: basato sull'utilizzo per carichi di lavoro più piccoli e basato sulle risorse per prestazioni ottimizzate. Per informazioni su come stimare i costi per il tuo caso d'uso, consulta la sezione Stima dei prezzi.

Agent Retrieval mantiene le prestazioni elevate e la scalabilità massiccia disponibili in Vector Search 1.0, semplificando l'avvio e la scalabilità.

Concetti

Prima di iniziare, è utile comprendere i seguenti concetti di Agent Retrieval:

Raccolta: un container per un insieme di oggetti JSON correlati. È simile a una tabella in un database relazionale. Puoi creare molte raccolte all'interno di un singolo database.
Oggetto di dati: un singolo oggetto JSON archiviato all'interno di una raccolta.
Raccolta: schema: definisce la struttura e i vincoli degli oggetti di dati all'interno di una raccolta. Può essere configurato per le convalide dello schema sia rigorose che flessibili.
Indice di raccolta: consente una ricerca efficiente del vicino più prossimo approssimato (ANN) tra gli oggetti di dati all'interno di una raccolta. Una raccolta può avere più indici, ad esempio uno per ogni campo vettoriale negli oggetti di dati.

Stima dei prezzi

Prezzi e calcolatore prezzi di Agent Retrieval: i prezzi di Agent Retrieval includono il costo delle macchine virtuali utilizzate per ospitare gli indici di cui è stato eseguito il deployment, nonché le spese per la creazione e l'aggiornamento degli indici. Anche una configurazione minima (meno di 100 $al mese) può gestire un throughput elevato per casi d'uso di dimensioni moderate. Per stimare i costi mensili:

Vai al calcolatore prezzi di Agent Retrieval di Agent Platform.
Aggiorna le impostazioni a:
- Descrivi la tua raccolta
- Scegli il metodo di ricerca: KNN o ANN
- Deployment (disponibile solo per il metodo di ricerca ANN)
- Traffico mensile
- Acquisizione dei dati
La stima dei costi verrà aggiornata nel riquadro Dettagli sui costi.

Aree geografiche supportate

Sono supportate le seguenti regioni:

asia-east1
asia-northeast1
asia-southeast1
europe-north1
europe-west2
europe-west4
us-central1
us-east4
us-west1

Passaggi successivi

Prova la demo interattiva.
Scopri come creare una raccolta.