Verwenden Sie die folgenden Architekturleitfäden, um generative KI-Anwendungen mit Retrieval Augmented Generation (RAG) in Google Cloudzu entwerfen und bereitzustellen.
| Architekturleitfaden | Beschreibung |
|---|---|
| RAG-Infrastruktur für generative KI mit Gemini Enterprise und Vertex AI | Eine agentengesteuerte Architektur, die Gemini Enterprise als einheitliche Plattform verwendet, um einen End-to-End-RAG-Datenfluss für Unternehmensanwendungen zu orchestrieren, die Echtzeitdatenverfügbarkeit und eine erweiterte kontextbezogene Suche erfordern. |
| RAG-Infrastruktur für generative KI mit Vertex AI und Vektorsuche | Eine vollständig verwaltete, serverlose Architektur, die eine optimierte, leistungsstarke Vektorsuche für Anwendungen im großen Maßstab bietet. |
| RAG-Infrastruktur für generative KI mit Vertex AI und AlloyDB for PostgreSQL | Eine Architektur, in der Vektoreinbettungen zusammen mit Ihren Betriebsdaten in einer vollständig verwalteten Datenbank wie AlloyDB for PostgreSQL gespeichert werden. |
| Schnellstartlösung: Generative AI RAG mit Vertex AI und Cloud SQL | Eine Architektur, in der Vektoreinbettungen zusammen mit Ihren Betriebsdaten in einer vollständig verwalteten Datenbank wie Cloud SQL gespeichert werden. |
| RAG-Infrastruktur für generative KI mit GKE und Cloud SQL | Eine flexible, containerbasierte Architektur, die maximale Kontrolle bietet, um benutzerdefinierte Anwendungen mit Open-Source-Tools wie Ray, Hugging Face und LangChain zu erstellen. |
| GraphRAG-Infrastruktur für generative KI mit Vertex AI und Spanner Graph | Eine fortschrittliche RAG-Architektur, die die Vektorsuche mit Knowledge Graph-Abfragen kombiniert, um vernetzte, kontextbezogene Daten abzurufen. Dies führt zu detaillierteren und relevanteren Antworten der generativen KI. |
| CI/CD-Pipeline für RAG-Anwendungen nutzen | Eine Architektur für eine CI/CD-Pipeline (Continuous Integration/Continuous Deployment) für eine RAG-Anwendung in Google Cloud. |