Prima di iniziare

Prima di iniziare a utilizzare la ricerca vettoriale, devi scegliere un modello di incorporamento, preparare i dati e decidere il tipo di endpoint da utilizzare. Questa pagina fornisce alcune informazioni su come eseguire queste operazioni.

Preparare gli incorporamenti

Per utilizzare la ricerca vettoriale, devi avere gli incorporamenti pronti. Se li hai già, vai a Scegli un endpoint.

Per creare gli incorporamenti:

  1. Scegli un modello di embedding: sono disponibili molti modelli di embedding esterni, che offrono funzionalità diverse.

    Vector Search supporta embedding densi, embedding sparsi e ricerca ibrida. La ricerca ibrida utilizza embedding densi e sparsi in base al peso specificato per questi tipi di embedding.

    A seconda del caso d'uso, scegli uno dei seguenti tipi di modello:

    • Pronto all'uso: Se vuoi abbinare semanticamente testo a testo o testo a immagini in base alla pertinenza del testo o dell'immagine. Si tratta di un caso d'uso standard, quindi non è necessario addestrare o ottimizzare il modello. Incorporamenti di testo è un'opzione consigliata per questo caso d'uso. Agent Platform utilizza modelli di embedding densi.

    • Modello personalizzato per gli incorporamenti: se vuoi eseguire la corrispondenza in base ai tuoi dati o a un caso d'uso specifico.

  2. Prepara i dati: pulisci e pre-elabora i dati per assicurarti che siano in un formato utilizzabile dal modello di incorporamento.

  3. Addestra il modello di incorporamento se utilizzi un modello personalizzato: se scegli di utilizzare un modello di incorporamento personalizzato (ottimizzazione), devi addestrarlo sui tuoi dati. Questo può essere un processo lungo che dipende dalle dimensioni e dalla complessità dei tuoi dati. Se utilizzi un modello preaddestrato di Model Garden, puoi saltare questo passaggio.

  4. Genera incorporamenti: dopo l'addestramento del modello, utilizzalo per generare incorporamenti per i tuoi dati.

Scegliere un endpoint

Dopo aver creato l'indice, lo implementerai in un endpoint. Per maggiori informazioni, consulta Esegui il deployment e gestisci gli endpoint dell'indice pubblico e Esegui il deployment e gestisci gli endpoint dell'indice in una rete VPC. È utile decidere il tipo di endpoint necessario prima di creare l'indice.

Puoi eseguire il deployment dell'indice delle query in una delle seguenti posizioni:

  • Endpoint pubblico: se esegui il deployment su un endpoint pubblico, non è necessario configurare la rete. Le reti pubbliche hanno una latenza leggermente superiore, ma sono più veloci da configurare e più facili da gestire.

  • Endpoint privato: se vuoi utilizzare un VPC, devi prima configurare il networking. Vector Search supporta due tipi di rete privata.

Passaggi successivi

Dopo aver generato gli incorporamenti e deciso dove eseguire il deployment dell'indice, il passaggio successivo è configurare l'indice.