Fatturazione di RAG Engine su Gemini Enterprise Agent Platform

Questa pagina descrive i prezzi e la fatturazione di RAG Engine su Gemini Enterprise Agent Platform in base ai componenti di RAG Engine su Gemini Enterprise Agent Platform che utilizzi, come modelli, riordinamento e spazio di archiviazione vettoriale.

Per ulteriori informazioni, consulta la pagina di RAG Engine su Gemini Enterprise Agent Platform panoramica.

Prezzi e fatturazione

Questa tabella spiega come funziona la fatturazione quando utilizzi i componenti RAG.

Componente Come funziona la fatturazione con RAG Engine
Importazione dati RAG Engine supporta l'importazione di dati da diverse origini dati. Ad esempio, il caricamento di file locali, Cloud Storage e Google Drive. L'accesso ai file in queste origini dati da RAG Engine è senza costi, ma queste origini dati potrebbero addebitare costi per il trasferimento dei dati. Ad esempio, i costi di uscita dei dati.
Dati trasformazione (analisi dei file)
  • Parser predefinito: senza costi.
  • Parser LLM: RAG Engine utilizza il modello LLM che hai specificato per analizzare il file e vedrai e pagherai i costi del modello LLM direttamente dal tuo progetto.
  • Parser del layout di Document AI: RAG Engine utilizza il parser del layout di Document AI che hai specificato per elaborare il file e vedrai e pagherai l'utilizzo del parser del layout di Document AI direttamente dal tuo progetto.
Trasformazione dei dati (suddivisione dei file in blocchi) Supporta la suddivisione in blocchi di dimensioni fisse, che è senza costi.
Generazione di embedding

RAG Engine orchestra la generazione di embedding utilizzando il modello di embedding che hai specificato e al tuo progetto vengono addebitati i costi associati a questo modello.

Per ulteriori informazioni sui prezzi, consulta Costo della creazione e del deployment di modelli di AI in Gemini Enterprise Agent Platform.

Indicizzazione e recupero dei dati

RAG Engine supporta due categorie di database vettoriali per la ricerca vettoriale:

  • Database gestito da RAG
  • Database vettoriale Bring-Your-Own

Un database gestito da RAG ha due scopi:

  • Un database gestito da RAG archivia le risorse RAG, come i corpus RAG e i file RAG. I contenuti dei file sono esclusi.
  • A tua scelta, indicizzazione e recupero degli embedding per la ricerca vettoriale.

Un database gestito da RAG utilizza un'istanza di Spanner come backend.

Per ogni progetto, RAG Engine esegue il provisioning di un progetto specifico del cliente Google Cloud e gestisce le risorse gestite da RAG archiviate in RAG Engine, in modo che i dati siano isolati fisicamente.

Se scegli il livello di base o scalabile RagManagedDB, RAG Engine esegue il provisioning di un'istanza di Spanner Enterprise Edition nel progetto corrispondente:

  • Livello di base: 100 unità di elaborazione con backup
  • Livello scalabile: a partire da 1 nodo (1000 unità di elaborazione) e scalabilità automatica fino a 10 nodi con backup

Se un corpus RAG nel tuo progetto sceglie di utilizzare un database gestito da RAG per la ricerca vettoriale, ti verrà addebitato il costo dell'istanza di Spanner gestita da RAG.

RAG Engine mostra i costi di Spanner dal progetto gestito da RAG corrispondente al tuo Google Cloud progetto, in modo che tu possa visualizzare e pagare i costi dell'istanza di Spanner.

Per ulteriori dettagli sui prezzi di Spanner, consulta Prezzi di Spanner.

Riordinamento per RAG Engine su Gemini Enterprise Agent Platform

Dopo il recupero, sono supportati i seguenti strumenti di classificazione:

  • Riordinatore LLM: RAG Engine utilizza il modello LLM che hai specificato per riordinare i risultati del recupero e vedrai e pagherai i costi del modello LLM direttamente dal tuo progetto.
  • API Ranking di Agent Search: RAG Engine utilizza l' API Ranking di Agent Search per riordinare i risultati del recupero e vedrai e pagherai l'API Ranking direttamente dal tuo progetto.

Elimina RAG Engine

Gli esempi di codice riportati di seguito mostrano come eliminare un motore RAG per la Google Cloud console, Python e REST:

Passaggi successivi