Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Parametri di configurazione dell'indice

Per configurare gli indici per le ricerche di similarità, devi configurare i seguenti campi.

Per istruzioni su come configurare un indice, consulta Configurare i parametri dell'indice.

`NearestNeighborSearch`

Campi

Campi
`contentsDeltaUri`	`string` Consente di inserire, aggiornare o eliminare i contenuti di Vector Search `Index`. La stringa deve essere un percorso di directory di Cloud Storage valido, ad esempio `gs://BUCKET_NAME/PATH_TO_INDEX_DIR/`. Se imposti questo campo quando chiami `IndexService.UpdateIndex`, non è possibile aggiornare anche altri `Index` campi nell'ambito della stessa chiamata. Scopri come strutturare i singoli file di dati.
`isCompleteOverwrite`	`boolean` Se questo campo è impostato insieme a `contentsDeltaUri` quando chiami `IndexService.UpdateIndex`, i contenuti esistenti di `Index` verranno sostituiti dai dati di `contentsDeltaUri`. Quando questo campo è impostato su true, l' intero indice viene sovrascritto completamente con il nuovo file di metadati che fornisci.
`config`	`NearestNeighborSearchConfig` La configurazione di Vector Search `Index`.

contentsDeltaUri

string

Consente di inserire, aggiornare o eliminare i contenuti di Vector Search Index. La stringa deve essere un percorso di directory di Cloud Storage valido, ad esempio gs://BUCKET_NAME/PATH_TO_INDEX_DIR/.

Se imposti questo campo quando chiami IndexService.UpdateIndex, non è possibile aggiornare anche altri Index campi nell'ambito della stessa chiamata. Scopri come strutturare i singoli file di dati.

isCompleteOverwrite

boolean

Se questo campo è impostato insieme a contentsDeltaUri quando chiami IndexService.UpdateIndex, i contenuti esistenti di Index verranno sostituiti dai dati di contentsDeltaUri. Quando questo campo è impostato su true, l' intero indice viene sovrascritto completamente con il nuovo file di metadati che fornisci.

config

NearestNeighborSearchConfig

La configurazione di Vector Search Index.

`NearestNeighborSearchConfig`

Campi
`dimensions`	`int32` Obbligatorio. Il numero di dimensioni dei vettori di input. Utilizzato solo per gli incorporamenti densi.
`approximateNeighborsCount`	`int32` Obbligatorio se viene utilizzato l'algoritmo tree-AH. Il numero predefinito di vicini da trovare tramite una ricerca approssimativa prima che venga eseguito il riordinamento esatto. Il riordinamento esatto è una procedura in cui i risultati restituiti da un algoritmo di ricerca approssimativa vengono riordinati utilizzando un calcolo della distanza più costoso.
`ShardSize`	`ShardSize` La dimensione di ogni shard. Quando un indice è di grandi dimensioni, viene suddiviso in shard in base a la dimensione dello shard specificata. Durante la pubblicazione, ogni shard viene pubblicato su un nodo separato e viene scalato in modo indipendente.
`distanceMeasureType`	`DistanceMeasureType` La misurazione della distanza utilizzata nella ricerca del vicino più prossimo.
`featureNormType`	`FeatureNormType` Tipo di normalizzazione da eseguire su ciascun vettore.
`algorithmConfig`	`oneOf:` `TreeAhConfig` `BruteForceConfig` La configurazione degli algoritmi utilizzati da Vector Search utilizza per una ricerca efficiente. Utilizzato solo per gli incorporamenti densi. `TreeAhConfig`: opzioni di configurazione per l'utilizzo dell'algoritmo tree-AH. Per ulteriori informazioni, consulta questo blog Scaling deep retrieval with TensorFlow Recommenders and Vector Search `BruteForceConfig`: questa opzione implementa la ricerca lineare standard nel database per ogni query. Non sono presenti campi da configurare per una ricerca a forza bruta. Per selezionare questo algoritmo, passa un oggetto vuoto per `BruteForceConfig`.

`DistanceMeasureType`

Enum
`SQUARED_L2_DISTANCE`	Distanza euclidea (L₂)
`L1_DISTANCE`	Distanza di Manhattan (L₁)
`DOT_PRODUCT_DISTANCE`	Valore predefinito. Definita come il negativo del prodotto scalare. Tieni presente che un indice sparso supporta solo la distanza prodotto scalare.
`COSINE_DISTANCE`	Distanza coseno. Consigliamo vivamente di utilizzare DOT_PRODUCT_DISTANCE + UNIT_L2_NORM anziché la distanza COSINE. I nostri algoritmi sono stati ottimizzati maggiormente per la distanza DOT_PRODUCT e, se combinata con UNIT_L2_NORM, offre lo stesso ranking e la stessa equivalenza matematica della distanza COSINE.

`ShardSize`

Enum
`SHARD_SIZE_SMALL`	2 GiB per shard
`SHARD_SIZE_MEDIUM`	20 GiB per shard
`SHARD_SIZE_LARGE`	50 GiB per shard

`FeatureNormType`

Enum
`UNIT_L2_NORM`	Tipo di normalizzazione dell'unità L2.
`NONE`	Valore predefinito. Non è specificato alcun tipo di normalizzazione.

`TreeAhConfig`

Questi sono i campi da selezionare per l'algoritmo tree-AH.

Campi
`fractionLeafNodesToSearch`	`double`
	La frazione predefinita di nodi foglia in cui è possibile cercare qualsiasi query. Deve essere compresa nell'intervallo 0.0 - 1.0, esclusivo. Se non è impostato, il valore predefinito è 0,05.
`leafNodeEmbeddingCount`	`int32`
	Numero di incorporamenti su ciascun nodo foglia. Se non è impostato, il valore predefinito è 1000.
`leafNodesToSearchPercent`	`int32`
	Deprecato, utilizza `fractionLeafNodesToSearch`. La percentuale predefinita di nodi foglia in cui è possibile cercare qualsiasi query. Deve essere compresa nell'intervallo 1-100, inclusivo. Se non è impostato, il valore predefinito è 10 (ovvero 10%).

`BruteForceConfig`

Questa opzione implementa la ricerca lineare standard nel database per ogni query. Non sono presenti campi da configurare per una ricerca a forza bruta. Per selezionare questo algoritmo, passa un oggetto vuoto per BruteForceConfig a algorithmConfig.

Parametri di configurazione dell'indice Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

NearestNeighborSearch

NearestNeighborSearchConfig

DistanceMeasureType

ShardSize

FeatureNormType

TreeAhConfig

BruteForceConfig