Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelli supportati da RAG Engine su Gemini Enterprise Agent Platform

Questa pagina elenca i modelli Gemini, i modelli con deployment automatico e i modelli con API gestite su Agent Platform che supportano RAG Engine su Gemini Enterprise Agent Platform.

Modelli Gemini

I seguenti modelli supportano RAG Engine:

Fai clic per espandere i modelli supportati

I modelli Gemini ottimizzati non sono supportati quando i modelli Gemini utilizzano RAG Engine su Gemini Enterprise Agent Platform.

Modelli con deployment autonomo

RAG Engine su Gemini Enterprise Agent Platform supporta tutti i modelli in Model Garden.

Utilizza RAG Engine con gli endpoint dei modelli aperti di cui hai eseguito il deployment autonomo.

Sostituisci le variabili utilizzate nell'esempio di codice:

PROJECT_ID: il tuo ID progetto.
LOCATION: la regione in cui elaborare la richiesta.

ENDPOINT_ID: il tuo ID endpoint.

  # Create a model instance with your self-deployed open model endpoint
  rag_model = GenerativeModel(
      "projects/PROJECT_ID/locations/LOCATION/endpoints/ENDPOINT_ID",
      tools=[rag_retrieval_tool]
  )

Modelli con API gestite su Agent Platform

I modelli con API gestite sulla piattaforma Agent Platform che supportano il motore RAG includono:

Il seguente esempio di codice mostra come utilizzare l'API Gemini GenerateContent per creare un'istanza del modello generativo. L'ID modello, /publisher/meta/models/llama-3.1-405B-instruct-maas, si trova nella scheda del modello.

Sostituisci le variabili utilizzate nell'esempio di codice:

PROJECT_ID: il tuo ID progetto.
LOCATION: la regione in cui elaborare la richiesta.

RAG_RETRIEVAL_TOOL: lo strumento di recupero RAG.

  # Create a model instance with Llama 3.1 MaaS endpoint
  rag_model = GenerativeModel(
      "projects/PROJECT_ID/locations/LOCATION/publisher/meta/models/llama-3.1-405B-instruct-maas",
      tools=RAG_RETRIEVAL_TOOL
  )

Il seguente esempio di codice mostra come utilizzare l'API ChatCompletions compatibile con OpenAI per generare una risposta del modello.

Sostituisci le variabili utilizzate nell'esempio di codice:

PROJECT_ID: il tuo ID progetto.
LOCATION: la regione in cui elaborare la richiesta.
MODEL_ID: modello LLM per la generazione di contenuti. Ad esempio, meta/llama-3.1-405b-instruct-maas.
INPUT_PROMPT: il testo inviato all'LLM per la generazione di contenuti. Utilizza un prompt pertinente ai documenti in Agent Search.
RAG_CORPUS_ID: l'ID della risorsa del corpus RAG.
ROLE: il tuo ruolo.
USER: il tuo nome utente.

CONTENT: i tuoi contenuti.

  # Generate a response with Llama 3.1 MaaS endpoint
  response = client.chat.completions.create(
      model="MODEL_ID",
      messages=[{"ROLE": "USER", "content": "CONTENT"}],
      extra_body={
          "extra_body": {
              "google": {
                  "vertex_rag_store": {
                      "rag_resources": {
                          "rag_corpus": "RAG_CORPUS_ID"
                      },
                      "similarity_top_k": 10
                  }
              }
          }
      },
  )

Passaggi successivi

Utilizza i modelli di embedding con RAG Engine.

Modelli supportati da RAG Engine su Gemini Enterprise Agent Platform Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Modelli Gemini

Fai clic per espandere i modelli supportati

Modelli con deployment autonomo

Modelli con API gestite su Agent Platform

Passaggi successivi

Modelli supportati da RAG Engine su Gemini Enterprise Agent Platform