Dieses Dokument im Architecture Center enthält Architekturleitfäden, die Ihnen beim Erstellen und Bereitstellen von Arbeitslasten für generative KI in Google Cloudhelfen.
Informationen zum Einrichten, Bereitstellen, Bewerten und Ausführen von generativen KI-Anwendungen auf Foundation Models finden Sie unter Generative KI-Anwendungen bereitstellen und ausführen.
Allgemeine Architekturen
In den folgenden Leitfäden finden Sie allgemeine Architekturen für bestimmte geschäftliche und technische Anwendungsfälle von generativer KI:
| Leitfaden | Beschreibung |
|---|---|
| Personalisierte Marketingkampagnen erstellen | Media-Assets für personalisierte Marketingkampagnen erstellen |
| Personalisierte Produktempfehlungen erstellen | Personalisierte Produktempfehlungen basierend auf Nutzerpräferenzen für Einzelhandelsanwendungen generieren |
| Podcasts aus Audiodateien erstellen | Podcasts basierend auf Media-Dateien wie Live-Kommentaren zu einem Sportereignis generieren |
| Lösungen für Kundensupportanfragen generieren | Antworten auf Kundenfragen generieren, z. B. Anfragen zum technischen Support. |
Referenzarchitekturen
Die folgenden Leitfäden enthalten detaillierte Architekturbeispiele und Designempfehlungen für die Bereitstellung von Arbeitslasten und Infrastruktur für generative KI für bestimmte Anwendungsfälle:
| Leitfaden | Beschreibung |
|---|---|
| Nutzungsüberprüfung von Versicherungsansprüchen automatisieren | Verbessern Sie den Prozess für die Vorabgenehmigung (Prior Authorization, PA) und die Überprüfung der Nutzung (Utilization Review, UR) für Krankenversicherungsansprüche. |
| RAG-Infrastruktur mit Gemini Enterprise und Vertex AI | Orchestrieren Sie einen agentischen RAG-Workflow mit Echtzeitdatenverfügbarkeit und erweiterter kontextbezogener Suche. |
| RAG-Infrastruktur mit Vertex AI und Vektorsuche | Optimierte, leistungsstarke Vektorsuche für Anwendungen im großen Maßstab. |
| RAG-Infrastruktur mit Vertex AI und AlloyDB for PostgreSQL | Vektoreinbettungen zusammen mit Betriebsdaten in einer vollständig verwalteten AlloyDB for PostgreSQL-Datenbank speichern. |
| RAG-Infrastruktur mit Vertex AI und Cloud SQL | Speichert Vektoreinbettungen zusammen mit Betriebsdaten in einer vollständig verwalteten Cloud SQL-Datenbank. |
| RAG-Infrastruktur mit GKE und Cloud SQL | Benutzerdefinierte RAG-Anwendungen mit Open-Source-Tools wie Ray, Hugging Face und LangChain erstellen. |
| GraphRAG-Infrastruktur mit Vertex AI und Spanner Graph | Kombinieren Sie die Vektorsuche mit Knowledge Graph-Abfragen, um miteinander verbundene Kontextdaten abzurufen. |
| Private Verbindungen für RAG-fähige generative KI-Anwendungen | Sichern Sie die Netzwerkinfrastruktur für RAG-fähige generative KI-Anwendungen mit freigegebene VPC. |
| Harness-CI/CD-Pipeline für RAG-Anwendungen | Richten Sie eine Pipeline für Continuous Integration (CI) und Continuous Deployment (CD) für RAG-Anwendungen ein. |