Generative KI mit RAG

Last reviewed 2025-09-22 UTC

Verwenden Sie die folgenden Architekturleitfäden, um generative KI Anwendungen mit Retrieval Augmented Generation (RAG) in Google Cloudzu entwerfen und bereitzustellen.

Architekturleitfaden Beschreibung
RAG-Infrastruktur für generative KI mit Gemini Enterprise und Vertex AI Eine agentengesteuerte Architektur, die Gemini Enterprise als einheitliche Plattform verwendet, um einen End-to-End-RAG-Datenfluss für Unternehmensanwendungen zu orchestrieren, die Echtzeitdatenverfügbarkeit und eine erweiterte kontextbezogene Suche erfordern.
RAG-Infrastruktur für generative KI mit Vertex AI und der Vektorsuche Eine vollständig verwaltete, serverlose Architektur, die eine optimierte, leistungsstarke Vektorsuche für groß angelegte Anwendungen bietet.
RAG-Infrastruktur für generative KI mit Vertex AI und AlloyDB for PostgreSQL Eine Architektur, die Vektoreinbettungen zusammen mit Ihren Betriebsdaten in einer vollständig verwalteten Datenbank wie AlloyDB for PostgreSQL speichert.
Schnellstartlösung: Generative AI RAG mit Vertex AI und Cloud SQL Eine Architektur, die Vektoreinbettungen zusammen mit Ihren Betriebsdaten in einer vollständig verwalteten Datenbank wie Cloud SQL speichert.
RAG-Infrastruktur für generative KI mit GKE und Cloud SQL Eine flexible, containerbasierte Architektur, die maximale Kontrolle bietet, um benutzerdefinierte Anwendungen mit Open-Source-Tools wie Ray, Hugging Face und LangChain zu erstellen.
GraphRAG-Infrastruktur für generative KI mit Vertex AI und Spanner Graph Eine erweiterte RAG-Architektur, die die Vektorsuche mit Knowledge-Graph-Abfragen kombiniert, um verknüpfte, kontextbezogene Daten abzurufen. Dies führt zu detaillierteren und relevanteren Antworten der generativen KI.
CI/CD-Pipeline für RAG-Anwendungen nutzen Eine Architektur für eine CI/CD-Pipeline (Continuous Integration/Continuous Deployment) für eine RAG-Anwendung in Google Cloud.