Generative KI mit RAG

Verwenden Sie die folgenden Architekturleitfäden, um generative KI-Anwendungen mit Retrieval Augmented Generation (RAG) in Google Cloudzu entwerfen und bereitzustellen.

Architekturleitfaden Beschreibung
RAG-Infrastruktur für generative KI mit Gemini Enterprise und Vertex AI Eine agentengesteuerte Architektur, die Gemini Enterprise als einheitliche Plattform verwendet, um einen End-to-End-RAG-Datenfluss für Unternehmensanwendungen zu orchestrieren, die Echtzeitdatenverfügbarkeit und eine erweiterte kontextbezogene Suche erfordern.
RAG-Infrastruktur für generative KI mit Vertex AI und Vektorsuche Eine vollständig verwaltete, serverlose Architektur, die eine optimierte, leistungsstarke Vektorsuche für Anwendungen im großen Maßstab bietet.
RAG-Infrastruktur für generative KI mit Vertex AI und AlloyDB for PostgreSQL Eine Architektur, in der Vektoreinbettungen zusammen mit Ihren Betriebsdaten in einer vollständig verwalteten Datenbank wie AlloyDB for PostgreSQL gespeichert werden.
Schnellstartlösung: Generative AI RAG mit Vertex AI und Cloud SQL Eine Architektur, in der Vektoreinbettungen zusammen mit Ihren Betriebsdaten in einer vollständig verwalteten Datenbank wie Cloud SQL gespeichert werden.
RAG-Infrastruktur für generative KI mit GKE und Cloud SQL Eine flexible, containerbasierte Architektur, die maximale Kontrolle bietet, um benutzerdefinierte Anwendungen mit Open-Source-Tools wie Ray, Hugging Face und LangChain zu erstellen.
GraphRAG-Infrastruktur für generative KI mit Vertex AI und Spanner Graph Eine fortschrittliche RAG-Architektur, die die Vektorsuche mit Knowledge Graph-Abfragen kombiniert, um vernetzte, kontextbezogene Daten abzurufen. Dies führt zu detaillierteren und relevanteren Antworten der generativen KI.
CI/CD-Pipeline für RAG-Anwendungen nutzen Eine Architektur für eine CI/CD-Pipeline (Continuous Integration/Continuous Deployment) für eine RAG-Anwendung in Google Cloud.