Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Fatturazione di RAG Engine su Gemini Enterprise Agent Platform

Questa pagina descrive i prezzi e la fatturazione di RAG Engine su Gemini Enterprise Agent Platform in base ai componenti di RAG Engine su Gemini Enterprise Agent Platform che utilizzi, come modelli, riordinamento e spazio di archiviazione vettoriale.

Per ulteriori informazioni, consulta la pagina di RAG Engine su Gemini Enterprise Agent Platform panoramica.

Prezzi e fatturazione

Questa tabella spiega come funziona la fatturazione quando utilizzi i componenti RAG.

Componente	Come funziona la fatturazione con RAG Engine
Importazione dati	RAG Engine supporta l'importazione di dati da diverse origini dati. Ad esempio, il caricamento di file locali, Cloud Storage e Google Drive. L'accesso ai file in queste origini dati da RAG Engine è senza costi, ma queste origini dati potrebbero addebitare costi per il trasferimento dei dati. Ad esempio, i costi di uscita dei dati.
Dati trasformazione (analisi dei file)	Parser predefinito: senza costi. Parser LLM: RAG Engine utilizza il modello LLM che hai specificato per analizzare il file e vedrai e pagherai i costi del modello LLM direttamente dal tuo progetto. Parser del layout di Document AI: RAG Engine utilizza il parser del layout di Document AI che hai specificato per elaborare il file e vedrai e pagherai l'utilizzo del parser del layout di Document AI direttamente dal tuo progetto.
Trasformazione dei dati (suddivisione dei file in blocchi)	Supporta la suddivisione in blocchi di dimensioni fisse, che è senza costi.
Generazione di embedding	RAG Engine orchestra la generazione di embedding utilizzando il modello di embedding che hai specificato e al tuo progetto vengono addebitati i costi associati a questo modello. Per ulteriori informazioni sui prezzi, consulta Costo della creazione e del deployment di modelli di AI in Gemini Enterprise Agent Platform.
Indicizzazione e recupero dei dati	Nota: RAG Engine su Gemini Enterprise Agent Platform utilizza Spanner come backend per le operazioni di indicizzazione e recupero dei dati. L'utilizzo di Spanner comporta addebiti di fatturazione associati charges. Per ulteriori informazioni, consulta Prezzi di Spanner. RAG Engine supporta due categorie di database vettoriali per la ricerca vettoriale: Database gestito da RAG Database vettoriale Bring-Your-Own Un database gestito da RAG ha due scopi: Un database gestito da RAG archivia le risorse RAG, come i corpus RAG e i file RAG. I contenuti dei file sono esclusi. A tua scelta, indicizzazione e recupero degli embedding per la ricerca vettoriale. Un database gestito da RAG utilizza un'istanza di Spanner come backend. Per ogni progetto, RAG Engine esegue il provisioning di un progetto specifico del cliente Google Cloud e gestisce le risorse gestite da RAG archiviate in RAG Engine, in modo che i dati siano isolati fisicamente. Se scegli il livello di base o scalabile `RagManagedDB`, RAG Engine esegue il provisioning di un'istanza di Spanner Enterprise Edition nel progetto corrispondente: Livello di base: 100 unità di elaborazione con backup Livello scalabile: a partire da 1 nodo (1000 unità di elaborazione) e scalabilità automatica fino a 10 nodi con backup Se un corpus RAG nel tuo progetto sceglie di utilizzare un database gestito da RAG per la ricerca vettoriale, ti verrà addebitato il costo dell'istanza di Spanner gestita da RAG. RAG Engine mostra i costi di Spanner dal progetto gestito da RAG corrispondente al tuo Google Cloud progetto, in modo che tu possa visualizzare e pagare i costi dell'istanza di Spanner. Per ulteriori dettagli sui prezzi di Spanner, consulta Prezzi di Spanner.
Riordinamento per RAG Engine su Gemini Enterprise Agent Platform	Dopo il recupero, sono supportati i seguenti strumenti di classificazione: Riordinatore LLM: RAG Engine utilizza il modello LLM che hai specificato per riordinare i risultati del recupero e vedrai e pagherai i costi del modello LLM direttamente dal tuo progetto. API Ranking di Agent Search: RAG Engine utilizza l' API Ranking di Agent Search per riordinare i risultati del recupero e vedrai e pagherai l'API Ranking direttamente dal tuo progetto.

Elimina RAG Engine

Gli esempi di codice riportati di seguito mostrano come eliminare un motore RAG per la Google Cloud console, Python e REST:

Parametri API e esempi di codice della versione 1 (v1).
Parametri API v1beta1 e esempi di codice.

Passaggi successivi

Per scoprire come utilizzare l'SDK Vertex AI per eseguire le attività di RAG Engine su Gemini Enterprise Agent Platform, consulta la guida rapida di RAG per Python.
Per scoprire di più sul grounding, consulta la panoramica del grounding.
Per scoprire di più sulle risposte di RAG, consulta Output di recupero e generazione di RAG Engine.
Per scoprire di più sull'architettura RAG:
- Infrastruttura per un'applicazione di AI generativa compatibile con RAG utilizzando Agent Platform e Vector Search
- Infrastruttura per un'applicazione di AI generativa compatibile con RAG utilizzando la piattaforma agentica e AlloyDB per PostgreSQL.