Prima di iniziare

Prima di iniziare a utilizzare Vector Search, devi scegliere un modello di embedding, preparare i dati e decidere il tipo di endpoint da utilizzare. Questa pagina fornisce alcune informazioni su come eseguire queste operazioni.

Preparare gli embedding

Per utilizzare Vector Search, devi avere gli embedding pronti. Se hai già gli embedding, vai a Scegliere un endpoint.

Per creare gli embedding:

  1. Scegli un modello di embedding: sono disponibili molti modelli di embedding esterni, che offrono funzionalità diverse.

    Vector Search supporta embedding densi, embedding sparsi e ricerca ibrida. La ricerca ibrida utilizza embedding densi e sparsi in base al peso specificato per questi tipi di embedding.

    A seconda del caso d'uso, scegli uno dei seguenti tipi di modello:

    • Pronto all'uso: se vuoi abbinare semanticamente testo a testo o testo a immagini in base alla pertinenza del testo o dell'immagine. Si tratta di un caso d'uso standard, quindi non devi addestrare o ottimizzare il modello. L' embedding di testo è un'opzione consigliata per questo caso d'uso. Agent Platform utilizza modelli di embedding densi.

    • Modello personalizzato per gli embedding: se vuoi eseguire la corrispondenza in base ai tuoi dati o a un caso d'uso specifico.

  2. Prepara i dati: pulisci ed esegui la pre-elaborazione dei dati per assicurarti che siano in un formato utilizzabile dal modello di embedding.

  3. Addestra il modello di embedding se utilizzi un modello personalizzato: se scegli di utilizzare un modello di embedding personalizzato (ottimizzazione), devi addestrarlo sui tuoi dati. Questo può essere un processo che richiede molto tempo e dipende dalle dimensioni e dalla complessità dei dati. Se utilizzi un modello preaddestrato da Model Garden, puoi saltare questo passaggio.

  4. Genera embedding: dopo aver addestrato il modello, utilizzalo per generare embedding per i tuoi dati.

Scegliere un endpoint

Dopo aver creato l'indice, devi eseguirne il deployment in un endpoint. Per ulteriori informazioni, consulta Eseguire il deployment e gestire gli endpoint di indice pubblici ed Eseguire il deployment e gestire gli endpoint di indice in una rete VPC. È utile decidere il tipo di endpoint di cui avrai bisogno prima di creare l'indice.

Puoi eseguire il deployment dell'indice di query in uno dei seguenti:

Passaggi successivi

Dopo aver generato gli embedding e aver deciso dove eseguire il deployment dell'indice, il passaggio successivo consiste nel configurare l'indice.