La piattaforma agentica Gemini Enterprise fornisce due metriche per il monitoraggio di IndexEndpoint di un indice di cui è stato eseguito il deployment:
aiplatform.googleapis.com/matching_engine/current_shardsIl numero di shard di
DeployedIndex. Man mano che i dati vengono aggiunti ed eliminati, la ricerca vettoriale esegue automaticamente lo sharding dell'indice per ottenere prestazioni ottimali. Questa metrica indica il numero attuale di shard dell'indice di cui è stato eseguito il deployment.aiplatform.googleapis.com/matching_engine/current_replicasIl numero totale di server di replica attivi utilizzati da
DeployedIndex. Per corrispondere al volume di query, la ricerca vettoriale attiva o disattiva automaticamente i server di replica in base alle impostazioni minime e massime delle repliche specificate durante il deployment dell'indice.Se l'indice ha più shard, ogni shard può essere gestito utilizzando un numero diverso di server di replica. Questa metrica è il numero totale di server di replica in tutti gli shard dell'indice specificato.
Passaggi successivi
- Scopri come eseguire query sugli indici per trovare gli elementi più prossimi.
- Scopri come selezionare, eseguire query e visualizzare queste metriche in Esplora metriche.