Vector Search 2.0 è un prodotto Google Cloud progettato da zero come motore di ricerca auto-ottimizzato, completamente gestito e nativo per l'AI. Mentre la ricerca vettoriale esistente di Google Cloud è un potente sistema di indicizzazione come servizio di ricerca approssimativa del vicino più prossimo (ANN), la ricerca vettoriale 2.0 trasforma questo concetto in un sistema completo di archiviazione e recupero. Anziché gestire gli indici come risorsa principale, lavorerai con le raccolte di oggetti di dati.
L'architettura del motore di ricerca fornisce un motore di archiviazione replicato e scalabile, rendendo Vector Search 2.0 un'unica origine dati unificata per le tue applicazioni di AI ed eliminando la necessità di archiviazione di dati ausiliari.
I vantaggi principali di questa nuova architettura includono:
Facile da usare per gli sviluppatori:inizia rapidamente con librerie client intuitive che richiedono un codice minimo. Il sistema viene ottimizzato automaticamente per mantenere prestazioni elevate, astraendo l'infrastruttura sottostante in modo da non dover configurare VM o repliche.
Onboarding e valutazione rapidi: crea raccolte, aggiungi i tuoi dati e inizia a eseguire ricerche rapidamente.
Archiviazione unificata dei dati:archivia, recupera e filtra i documenti in base alla somiglianza vettoriale e ai dati del payload, tutto in un unico posto.
Funzionalità avanzate:compila automaticamente i campi di incorporamento utilizzando modelli integrati, esplora i tuoi dati con funzionalità di query avanzate, porta i tuoi incorporamenti (BYOE) e crea rapidamente indici per scalare le prestazioni.
Prezzi semplificati:i prezzi adattabili prevedono due modelli: basati sull'utilizzo per i workload più piccoli e basati sulle risorse per prestazioni ottimizzate.
Vector Search 2.0 mantiene le prestazioni elevate e la scalabilità massiccia disponibili in Vector Search 1.0, semplificando l'avvio e la scalabilità.
Concetti
Prima di iniziare, è utile comprendere i seguenti concetti di Vector Search 2.0:
Raccolta: un contenitore per un insieme di oggetti JSON correlati. È simile a una tabella in un database relazionale. Puoi creare molte raccolte all'interno di un singolo database.
Oggetto dati: un singolo oggetto JSON memorizzato all'interno di una raccolta.
Collection: schema: definisce la struttura e i vincoli degli oggetti dati all'interno di una raccolta. Può essere configurato per le convalide dello schema esatte e flessibili.
Indice della raccolta:consente una ricerca approssimativa efficiente del vicino più prossimo (ANN) tra gli oggetti dati all'interno di una raccolta. Una raccolta può avere più indici, ad esempio uno per ogni campo vettoriale negli oggetti dati.
Passaggi successivi
- Scopri come creare una raccolta.