Gestire la modalità Spanner

Nella modalità di deployment Spanner, RAG Engine utilizza RagManagedDb, un'istanza Spanner completamente gestita e pronta per l'uso aziendale che viene utilizzata per l'archiviazione delle risorse da RAG Engine su Gemini Enterprise Agent Platform. Google Cloud Facoltativamente, puoi utilizzarla come database vettoriale di tua scelta per i corpus RAG.

Tramite Spanner, RAG Engine offre un database dedicato, coerente, a elevata disponibilità e altamente scalabile per supportare la tua applicazione. Per saperne di più su Google Cloud Spanner, consulta Spanner.

RAG Engine archivia i metadati delle risorse del corpus RAG e dei file RAG in RagManagedDb, indipendentemente dal database vettoriale scelto. I database vettoriali vengono utilizzati solo per l'archiviazione e il recupero degli embedding. Oltre all'archiviazione delle risorse, RagManagedDb può essere utilizzato anche per archiviare e gestire le rappresentazioni vettoriali dei documenti. Il database vettoriale viene quindi utilizzato per recuperare i documenti pertinenti in base alla somiglianza semantica del documento con una determinata query.

Livelli disponibili

RAG Engine ti consente di scalare l'istanza RagManagedDb in base ai requisiti di utilizzo e prestazioni utilizzando una scelta di due livelli. Puoi anche utilizzarlo per eliminare i dati di RAG Engine con un terzo livello.

Il livello è un'impostazione a livello di progetto disponibile nella risorsa RagEngineConfig che influisce sui corpus RAG che utilizzano RagManagedDb. I seguenti livelli sono disponibili in RagEngineConfig:

  • Livello scalato: questo livello offre prestazioni su scala di produzione e funzionalità di scalabilità automatica. È adatto ai clienti con grandi quantità di dati o carichi di lavoro sensibili alle prestazioni. Internamente, questo livello imposta l'istanza Spanner sulla configurazione di scalabilità automatica con un minimo di 1 nodo (1000 unità di elaborazione) e un massimo di 10 nodi (10.000 unità di elaborazione).

  • Livello di base (impostazione predefinita): questo livello offre un livello di computing economico e basso, che potrebbe essere adatto ad alcuni dei seguenti casi:

    • Sperimentazione con RagManagedDb
    • Dimensioni ridotte dei dati
    • Carichi di lavoro insensibili alla latenza
    • Utilizzo di RAG Engine solo con altri database vettoriali

Per offrire il livello di base, RagManagedDb imposta l'istanza Spanner sottostante su una configurazione fissa di 100 unità di elaborazione, che equivale a 0,1 nodi.

  • Livello non sottoposto a provisioning: questo livello elimina RagManagedDb e l'istanza Spanner sottostante. Il livello non sottoposto a provisioning disabilita il servizio RAG Engine ed elimina i dati contenuti in questo servizio indipendentemente dal database vettoriale utilizzato per RagCorpora. In questo modo, la fatturazione del servizio viene interrotta. Per ulteriori informazioni sulla fatturazione, consulta Fatturazione di RAG Engine.

Una volta eliminati, i dati non possono essere recuperati. Per ricominciare a utilizzare RAG Engine, devi aggiornare il livello chiamando l'API UpdateRagEngineConfig o passare alla modalità serverless.

Gestione dei livelli

Per leggere e aggiornare i livelli, utilizza le API GetRagEngineConfig e UpdateRagEngineConfig. Per esempi di codice su come utilizzare queste API, consulta la pagina Passaggio da una modalità all'altra.