Gestire la modalità Spanner

Nella modalità di deployment di Spanner, Vertex AI RAG Engine utilizza RagManagedDb, che è un'istanza Spanner completamente gestita e pronta per l'uso aziendale Google Cloud utilizzata per l'archiviazione delle risorse da Vertex AI RAG Engine. Se vuoi, puoi utilizzarlo come database vettoriale di tua scelta per i tuoi corpus RAG.

Tramite Spanner, Vertex AI RAG Engine offre un database dedicato coerente, a disponibilità elevata e altamente scalabile per supportare la tua applicazione. Per scoprire di più su Google Cloud Spanner, consulta Spanner.

Il motore RAG di Vertex AI archivia i metadati delle risorse del corpus RAG e dei file RAG in RagManagedDb, indipendentemente dalla scelta del database vettoriale. I database vettoriali vengono utilizzati solo per l'archiviazione e il recupero degli embedding. Oltre all'archiviazione delle risorse, RagManagedDb può essere utilizzato anche per archiviare e gestire le rappresentazioni vettoriali dei documenti. Il database vettoriale viene quindi utilizzato per recuperare i documenti pertinenti in base alla somiglianza semantica del documento con una determinata query.

Livelli disponibili

Vertex AI RAG Engine ti consente di scalare l'istanza RagManagedDb in base ai tuoi requisiti di utilizzo e prestazioni utilizzando una scelta di due livelli. Puoi anche utilizzarlo per eliminare i dati del motore RAG di Vertex AI con un terzo livello.

Il livello è un'impostazione a livello di progetto disponibile nella risorsa RagEngineConfig che influisce sui corpus RAG utilizzando RagManagedDb. In RagEngineConfig sono disponibili i seguenti livelli:

  • Livello scalato:questo livello offre prestazioni su scala di produzione insieme alla funzionalità di scalabilità automatica. È adatto ai clienti con grandi quantità di dati o workload sensibili alle prestazioni. A livello interno, questo livello imposta l'istanza Spanner sulla configurazione di scalabilità automatica con un minimo di 1 nodo (1000 unità di elaborazione) e un massimo di 10 nodi (10.000 unità di elaborazione).

  • Livello base (predefinito): questo livello offre un livello di computing economico e basso, che potrebbe essere adatto ad alcuni dei seguenti casi:

    • È in corso l'esperimento con RagManagedDb
    • Dati di piccole dimensioni
    • Carichi di lavoro non sensibili alla latenza
    • Utilizzo di Vertex AI RAG Engine solo con altri database vettoriali

Per offrire il livello base, RagManagedDb imposta l'istanza Spanner sottostante su una configurazione fissa di 100 unità di elaborazione, che equivale a 0,1 nodi.

  • Livello di cui non è stato eseguito il provisioning:questo livello elimina RagManagedDb e la relativa istanza Spanner sottostante. Il livello Non provisionato disattiva il servizio Vertex AI RAG Engine ed elimina i dati contenuti in questo servizio indipendentemente dal database vettoriale utilizzato per il tuo RagCorpora. In questo modo, la fatturazione del servizio viene interrotta. Per ulteriori informazioni sulla fatturazione, consulta la pagina Fatturazione di Vertex AI RAG Engine.

Una volta eliminati, i dati non possono essere recuperati. Per ricominciare a utilizzare il motore RAG di Vertex AI, devi aggiornare il livello chiamando l'API UpdateRagEngineConfig o passare alla modalità serverless.

Gestione dei livelli

Per leggere e aggiornare i tuoi livelli, utilizza le API GetRagEngineConfig e UpdateRagEngineConfig. Consulta la pagina Passare da una modalità all'altra per esempi di codice su come utilizzare queste API.