Questa pagina descrive i prezzi e la fatturazione di RAG Engine su Gemini Enterprise Agent Platform in base ai componenti di RAG Engine su Gemini Enterprise Agent Platform che utilizzi, come modelli, riordinamento e spazio di archiviazione vettoriale.
Per ulteriori informazioni, consulta la pagina di RAG Engine su Gemini Enterprise Agent Platform panoramica.
Prezzi e fatturazione
Questa tabella spiega come funziona la fatturazione quando utilizzi i componenti RAG.
| Componente | Come funziona la fatturazione con RAG Engine |
|---|---|
| Importazione dati | RAG Engine supporta l'importazione di dati da diverse origini dati. Ad esempio, il caricamento di file locali, Cloud Storage e Google Drive. L'accesso ai file in queste origini dati da RAG Engine è senza costi, ma queste origini dati potrebbero addebitare costi per il trasferimento dei dati. Ad esempio, i costi di uscita dei dati. |
| Dati trasformazione (analisi dei file) |
|
| Trasformazione dei dati (suddivisione dei file in blocchi) | Supporta la suddivisione in blocchi di dimensioni fisse, che è senza costi. |
| Generazione di embedding |
RAG Engine orchestra la generazione di embedding utilizzando il modello di embedding che hai specificato e al tuo progetto vengono addebitati i costi associati a questo modello. Per ulteriori informazioni sui prezzi, consulta Costo della creazione e del deployment di modelli di AI in Gemini Enterprise Agent Platform. |
| Indicizzazione e recupero dei dati |
RAG Engine supporta due categorie di database vettoriali per la ricerca vettoriale:
Un database gestito da RAG ha due scopi:
Un database gestito da RAG utilizza un'istanza di Spanner come backend. Per ogni progetto, RAG Engine esegue il provisioning di un progetto specifico del cliente Google Cloud e gestisce le risorse gestite da RAG archiviate in RAG Engine, in modo che i dati siano isolati fisicamente.
Se scegli il livello di base o scalabile
Se un corpus RAG nel tuo progetto sceglie di utilizzare un database gestito da RAG per la ricerca vettoriale, ti verrà addebitato il costo dell'istanza di Spanner gestita da RAG. RAG Engine mostra i costi di Spanner dal progetto gestito da RAG corrispondente al tuo Google Cloud progetto, in modo che tu possa visualizzare e pagare i costi dell'istanza di Spanner. Per ulteriori dettagli sui prezzi di Spanner, consulta Prezzi di Spanner. |
| Riordinamento per RAG Engine su Gemini Enterprise Agent Platform |
Dopo il recupero, sono supportati i seguenti strumenti di classificazione:
|
Elimina RAG Engine
Gli esempi di codice riportati di seguito mostrano come eliminare un motore RAG per la Google Cloud console, Python e REST:
Parametri API e esempi di codice della versione 1 (v1).
Parametri API v1beta1 e esempi di codice.
Passaggi successivi
Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività di RAG Engine su Gemini Enterprise Agent Platform, consulta la guida rapida di RAG per Python.
Per scoprire di più sul grounding, consulta la panoramica del grounding.
Per scoprire di più sulle risposte di RAG, consulta Output di recupero e generazione di RAG Engine.
Per scoprire di più sull'architettura RAG: