Auf dieser Seite sind Gemini-Modelle, selbst bereitgestellte Modelle und Modelle mit verwalteten APIs auf der Agent Platform aufgeführt, die die RAG Engine auf der Gemini Enterprise Agent Platform unterstützen.
Gemini-Modelle
Die folgenden Modelle unterstützen die RAG Engine:
Klicken Sie, um unterstützte Modelle zu maximieren.
Abgestimmte Gemini-Modelle werden nicht unterstützt, wenn die Gemini-Modelle die RAG Engine auf der Gemini Enterprise Agent Platform verwenden.
Selbst bereitgestellte Modelle
Die RAG Engine auf der Gemini Enterprise Agent Platform unterstützt alle Modelle im Model Garden.
RAG Engine mit selbst bereitgestellten Open-Model-Endpunkten verwenden
Ersetzen Sie die im Codebeispiel verwendeten Variablen:
- PROJECT_ID: Ihre Projekt-ID.
- LOCATION: Die Region, in der Ihre Anfrage verarbeitet werden soll.
ENDPOINT_ID: Ihre Endpunkt-ID.
# Create a model instance with your self-deployed open model endpoint rag_model = GenerativeModel( "projects/PROJECT_ID/locations/LOCATION/endpoints/ENDPOINT_ID", tools=[rag_retrieval_tool] )
Modelle mit verwalteten APIs auf der Agent Platform
Die Modelle mit verwalteten APIs auf der Agent Platform, die die RAG Engine unterstützen, sind:
Im folgenden Codebeispiel wird gezeigt, wie Sie mit der Gemini GenerateContent API eine generative Modellinstanz erstellen. Die Modell-ID, /publisher/meta/models/llama-3.1-405B-instruct-maas, finden Sie auf der Modellkarte.
Ersetzen Sie die im Codebeispiel verwendeten Variablen:
- PROJECT_ID: Ihre Projekt-ID.
- LOCATION: Die Region, in der Ihre Anfrage verarbeitet werden soll.
RAG_RETRIEVAL_TOOL: Ihr RAG-Abruftool.
# Create a model instance with Llama 3.1 MaaS endpoint rag_model = GenerativeModel( "projects/PROJECT_ID/locations/LOCATION/publisher/meta/models/llama-3.1-405B-instruct-maas", tools=RAG_RETRIEVAL_TOOL )
Das folgende Codebeispiel zeigt, wie Sie die OpenAI-kompatible ChatCompletions API verwenden, um eine Modellantwort zu generieren.
Ersetzen Sie die im Codebeispiel verwendeten Variablen:
- PROJECT_ID: Ihre Projekt-ID.
- LOCATION: Die Region, in der Ihre Anfrage verarbeitet werden soll.
- MODEL_ID: LLM-Modell für die Inhaltsgenerierung. Beispiel:
meta/llama-3.1-405b-instruct-maas. - INPUT_PROMPT: Der Text, der zur Inhaltsgenerierung an das LLM gesendet wird. Verwenden Sie einen Prompt, der für die Dokumente in der Agent Search relevant ist.
- RAG_CORPUS_ID: Die ID der RAG-Korpusressource.
- ROLE: Ihre Rolle.
- USER: Ihr Nutzername.
CONTENT: Ihre Inhalte.
# Generate a response with Llama 3.1 MaaS endpoint response = client.chat.completions.create( model="MODEL_ID", messages=[{"ROLE": "USER", "content": "CONTENT"}], extra_body={ "extra_body": { "google": { "vertex_rag_store": { "rag_resources": { "rag_corpus": "RAG_CORPUS_ID" }, "similarity_top_k": 10 } } } }, )