Monitorare un indice di cui è stato eseguito il deployment

La piattaforma agentica Gemini Enterprise fornisce due metriche per il monitoraggio di IndexEndpoint di un indice di cui è stato eseguito il deployment:

  • aiplatform.googleapis.com/matching_engine/current_shards

    Il numero di shard di DeployedIndex. Man mano che i dati vengono aggiunti ed eliminati, la ricerca vettoriale esegue automaticamente lo sharding dell'indice per ottenere prestazioni ottimali. Questa metrica indica il numero attuale di shard dell'indice di cui è stato eseguito il deployment.

  • aiplatform.googleapis.com/matching_engine/current_replicas

    Il numero totale di server di replica attivi utilizzati da DeployedIndex. Per corrispondere al volume di query, la ricerca vettoriale attiva o disattiva automaticamente i server di replica in base alle impostazioni minime e massime delle repliche specificate durante il deployment dell'indice.

    Se l'indice ha più shard, ogni shard può essere gestito utilizzando un numero diverso di server di replica. Questa metrica è il numero totale di server di replica in tutti gli shard dell'indice specificato.

Passaggi successivi