La modalità serverless è il metodo consigliato per iniziare a utilizzare RAG Engine. Fornisce un database completamente gestito e altamente scalabile per supportare le risorse RAG Engine, senza la necessità di eseguire il provisioning o di occuparsi della gestione delle configurazioni dell'infrastruttura. Offre un onboarding rapido ed è adatta alla maggior parte degli utenti, inclusi quelli aziendali.
La modalità serverless è una funzionalità in anteprima ed è disponibile solo in us-central1. È disponibile per tutti e non richiede alcuna lista consentita.
Con la modalità serverless, il CUJ del motore RAG rimane identico a quello della modalità Spanner, ad eccezione delle seguenti differenze chiave:
RagManagedDbnon è disponibile come scelta di database vettoriale quando utilizzi la modalità serverless. Il nuovo database vettoriale predefinito è inveceRagManagedVertexVectorSearch, completamente gestito e altamente scalabile. Per scoprire di più su questo database vettoriale, consulta Utilizzare Vector Search 2.0 con RAG.- Le chiavi di crittografia gestite dal cliente (CMEK) non sono supportate in modalità serverless.
Passaggio alla modalità serverless
Per passare alla modalità serverless come modalità di deployment, consulta la pagina Cambiare modalità.
Eliminare i dati
Per eliminare i dati dalla modalità di deployment serverless:
- Assicurati che la modalità attiva sia impostata su Serverless.
- Chiama l'API
ListRagCorporaper visualizzare le risorse in questa modalità. - Elimina ogni corpus utilizzando l'API
DeleteRagCorpus.
Prezzi
Non sono previsti costi aggiuntivi quando utilizzi la modalità di deployment serverless. Tuttavia, se hai una modalità Spanner attiva, potresti comunque ricevere un addebito. Inoltre, potresti incorrere in addebiti per la scelta di modelli, il ranking e l'archiviazione dei vettori su RAG Engine. Per ulteriori informazioni, consulta la pagina Fatturazione di RAG Engine.