Prima di iniziare a utilizzare la ricerca vettoriale, devi scegliere un modello di incorporamento, preparare i dati e decidere il tipo di endpoint da utilizzare. Questa pagina fornisce alcune informazioni su come eseguire queste operazioni.
Preparare gli incorporamenti
Per utilizzare la ricerca vettoriale, devi avere gli incorporamenti pronti. Se li hai già, vai a Scegli un endpoint.
Per creare gli incorporamenti:
Scegli un modello di embedding: sono disponibili molti modelli di embedding esterni, che offrono funzionalità diverse.
Vector Search supporta embedding densi, embedding sparsi e ricerca ibrida. La ricerca ibrida utilizza embedding densi e sparsi in base al peso specificato per questi tipi di embedding.
A seconda del caso d'uso, scegli uno dei seguenti tipi di modello:
Pronto all'uso: Se vuoi abbinare semanticamente testo a testo o testo a immagini in base alla pertinenza del testo o dell'immagine. Si tratta di un caso d'uso standard, quindi non è necessario addestrare o ottimizzare il modello. Incorporamenti di testo è un'opzione consigliata per questo caso d'uso. Agent Platform utilizza modelli di embedding densi.
Modello personalizzato per gli incorporamenti: se vuoi eseguire la corrispondenza in base ai tuoi dati o a un caso d'uso specifico.
Prepara i dati: pulisci e pre-elabora i dati per assicurarti che siano in un formato utilizzabile dal modello di incorporamento.
Addestra il modello di incorporamento se utilizzi un modello personalizzato: se scegli di utilizzare un modello di incorporamento personalizzato (ottimizzazione), devi addestrarlo sui tuoi dati. Questo può essere un processo lungo che dipende dalle dimensioni e dalla complessità dei tuoi dati. Se utilizzi un modello preaddestrato di Model Garden, puoi saltare questo passaggio.
Genera incorporamenti: dopo l'addestramento del modello, utilizzalo per generare incorporamenti per i tuoi dati.
Scegliere un endpoint
Dopo aver creato l'indice, lo implementerai in un endpoint. Per maggiori informazioni, consulta Esegui il deployment e gestisci gli endpoint dell'indice pubblico e Esegui il deployment e gestisci gli endpoint dell'indice in una rete VPC. È utile decidere il tipo di endpoint necessario prima di creare l'indice.
Puoi eseguire il deployment dell'indice delle query in una delle seguenti posizioni:
Endpoint pubblico: se esegui il deployment su un endpoint pubblico, non è necessario configurare la rete. Le reti pubbliche hanno una latenza leggermente superiore, ma sono più veloci da configurare e più facili da gestire.
Endpoint privato: se vuoi utilizzare un VPC, devi prima configurare il networking. Vector Search supporta due tipi di rete privata.
Connessione di peering di rete VPC per una latenza di rete ridotta.
Private Service Connect per il consumo privato di servizi in reti VPC appartenenti a gruppi, team, progetti o organizzazioni diversi.
Passaggi successivi
Dopo aver generato gli incorporamenti e deciso dove eseguire il deployment dell'indice, il passaggio successivo è configurare l'indice.
- Scopri come configurare il formato e la struttura dei dati di input
- Scopri come creare un indice della Ricerca vettoriale utilizzando i tutorial sui blocchi note
- Scopri come gestire gli indici.