Prima di iniziare a utilizzare Vector Search, devi scegliere un modello di embedding, preparare i dati e decidere il tipo di endpoint da utilizzare. Questa pagina fornisce alcune informazioni su come eseguire queste operazioni.
Preparare gli embedding
Per utilizzare Vector Search, devi avere gli embedding pronti. Se hai già gli embedding, vai a Scegliere un endpoint.
Per creare gli embedding:
Scegli un modello di embedding: sono disponibili molti modelli di embedding esterni, che offrono funzionalità diverse.
Vector Search supporta embedding densi, embedding sparsi e ricerca ibrida. La ricerca ibrida utilizza embedding densi e sparsi in base al peso specificato per questi tipi di embedding.
A seconda del caso d'uso, scegli uno dei seguenti tipi di modello:
Pronto all'uso: se vuoi abbinare semanticamente testo a testo o testo a immagini in base alla pertinenza del testo o dell'immagine. Si tratta di un caso d'uso standard, quindi non devi addestrare o ottimizzare il modello. L' embedding di testo è un'opzione consigliata per questo caso d'uso. Agent Platform utilizza modelli di embedding densi.
Modello personalizzato per gli embedding: se vuoi eseguire la corrispondenza in base ai tuoi dati o a un caso d'uso specifico.
Prepara i dati: pulisci ed esegui la pre-elaborazione dei dati per assicurarti che siano in un formato utilizzabile dal modello di embedding.
Addestra il modello di embedding se utilizzi un modello personalizzato: se scegli di utilizzare un modello di embedding personalizzato (ottimizzazione), devi addestrarlo sui tuoi dati. Questo può essere un processo che richiede molto tempo e dipende dalle dimensioni e dalla complessità dei dati. Se utilizzi un modello preaddestrato da Model Garden, puoi saltare questo passaggio.
Genera embedding: dopo aver addestrato il modello, utilizzalo per generare embedding per i tuoi dati.
Scegliere un endpoint
Dopo aver creato l'indice, devi eseguirne il deployment in un endpoint. Per ulteriori informazioni, consulta Eseguire il deployment e gestire gli endpoint di indice pubblici ed Eseguire il deployment e gestire gli endpoint di indice in una rete VPC. È utile decidere il tipo di endpoint di cui avrai bisogno prima di creare l'indice.
Puoi eseguire il deployment dell'indice di query in uno dei seguenti:
Endpoint pubblico: se esegui il deployment in un endpoint pubblico, non devi configurare la rete. Le reti pubbliche hanno una latenza leggermente superiore, ma sono più veloci da configurare e più facili da gestire.
Endpoint privato: se vuoi utilizzare un VPC, devi prima configurare la rete. Vector Search supporta due tipi di rete privata.
Passaggi successivi
Dopo aver generato gli embedding e aver deciso dove eseguire il deployment dell'indice, il passaggio successivo consiste nel configurare l'indice.
- Scopri come configurare il formato e la struttura dei dati di input
- Scopri come creare un indice della Ricerca vettoriale utilizzando i tutorial dei notebook
- Scopri come gestire gli indici