Generative KI mit RAG

Last reviewed 2025-09-22 UTC

Verwenden Sie die folgenden Architekturleitfäden, um generative KI-Anwendungen mit Retrieval Augmented Generation (RAG) in Google Cloudzu entwerfen und bereitzustellen.

Architekturleitfaden	Beschreibung
RAG-Infrastruktur für generative KI mit Gemini Enterprise und Vertex AI	Eine agentengesteuerte Architektur, die Gemini Enterprise als einheitliche Plattform verwendet, um einen End-to-End-RAG-Datenfluss für Unternehmensanwendungen zu orchestrieren, die Echtzeitdatenverfügbarkeit und eine erweiterte kontextbezogene Suche erfordern.
RAG-Infrastruktur für generative KI mit Vertex AI und der Vektorsuche	Eine vollständig verwaltete, serverlose Architektur, die eine optimierte, leistungsstarke Vektorsuche für umfangreiche Anwendungen bietet.
RAG-Infrastruktur für generative KI mit Vertex AI und AlloyDB for PostgreSQL	Eine Architektur, in der Vektoreinbettungen zusammen mit Ihren Betriebsdaten in einer vollständig verwalteten Datenbank wie AlloyDB for PostgreSQL gespeichert werden.
Schnellstartlösung: Generative AI RAG mit Vertex AI und Cloud SQL	Eine Architektur, in der Vektoreinbettungen zusammen mit Ihren Betriebsdaten in einer vollständig verwalteten Datenbank wie Cloud SQL gespeichert werden.
RAG-Infrastruktur für generative KI mit GKE und Cloud SQL	Eine flexible, containerbasierte Architektur, die maximale Kontrolle bietet, um benutzerdefinierte Anwendungen mit Open-Source-Tools wie Ray, Hugging Face und LangChain zu erstellen.
GraphRAG-Infrastruktur für generative KI mit Vertex AI und Spanner Graph	Eine fortschrittliche RAG-Architektur, die die Vektorsuche mit Knowledge Graph-Abfragen kombiniert, um vernetzte, kontextbezogene Daten abzurufen. Dies führt zu detaillierteren und relevanteren Antworten der generativen KI.
CI/CD-Pipeline für RAG-Anwendungen nutzen	Eine Architektur für eine CI/CD-Pipeline (Continuous Integration/Continuous Deployment) für eine RAG-Anwendung in Google Cloud.

Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.

Zuletzt aktualisiert: 2025-09-22 (UTC).