Architekturleitfäden für generative KI

Last reviewed 2025-01-06 UTC

Dieses Dokument im Architecture Center enthält Architekturleitfäden, die Ihnen beim Erstellen und Bereitstellen von Arbeitslasten für generative KI in Google Cloudhelfen.

Informationen zum Einrichten, Bereitstellen, Bewerten und Ausführen von generativen KI-Anwendungen auf Foundation Models finden Sie unter Generative KI-Anwendungen bereitstellen und ausführen.

Allgemeine Architekturen

In den folgenden Leitfäden finden Sie allgemeine Architekturen für bestimmte geschäftliche und technische Anwendungsfälle von generativer KI:

Leitfaden Beschreibung
Personalisierte Marketingkampagnen erstellen Media-Assets für personalisierte Marketingkampagnen erstellen
Personalisierte Produktempfehlungen erstellen Personalisierte Produktempfehlungen basierend auf Nutzerpräferenzen für Einzelhandelsanwendungen generieren
Podcasts aus Audiodateien erstellen Podcasts basierend auf Media-Dateien wie Live-Kommentaren zu einem Sportereignis generieren
Lösungen für Kundensupportanfragen generieren Antworten auf Kundenfragen generieren, z. B. Anfragen zum technischen Support.

Referenzarchitekturen

Die folgenden Leitfäden enthalten detaillierte Architekturbeispiele und Designempfehlungen für die Bereitstellung von Arbeitslasten und Infrastruktur für generative KI für bestimmte Anwendungsfälle:

Leitfaden Beschreibung
Nutzungsüberprüfung von Versicherungsansprüchen automatisieren Verbessern Sie den Prozess für die Vorabgenehmigung (Prior Authorization, PA) und die Überprüfung der Nutzung (Utilization Review, UR) für Krankenversicherungsansprüche.
RAG-Infrastruktur mit Gemini Enterprise und Vertex AI Orchestrieren Sie einen agentischen RAG-Workflow mit Echtzeitdatenverfügbarkeit und erweiterter kontextbezogener Suche.
RAG-Infrastruktur mit Vertex AI und Vektorsuche Optimierte, leistungsstarke Vektorsuche für Anwendungen im großen Maßstab.
RAG-Infrastruktur mit Vertex AI und AlloyDB for PostgreSQL Vektoreinbettungen zusammen mit Betriebsdaten in einer vollständig verwalteten AlloyDB for PostgreSQL-Datenbank speichern.
RAG-Infrastruktur mit Vertex AI und Cloud SQL Speichert Vektoreinbettungen zusammen mit Betriebsdaten in einer vollständig verwalteten Cloud SQL-Datenbank.
RAG-Infrastruktur mit GKE und Cloud SQL Benutzerdefinierte RAG-Anwendungen mit Open-Source-Tools wie Ray, Hugging Face und LangChain erstellen.
GraphRAG-Infrastruktur mit Vertex AI und Spanner Graph Kombinieren Sie die Vektorsuche mit Knowledge Graph-Abfragen, um miteinander verbundene Kontextdaten abzurufen.
Private Verbindungen für RAG-fähige generative KI-Anwendungen Sichern Sie die Netzwerkinfrastruktur für RAG-fähige generative KI-Anwendungen mit freigegebene VPC.
Harness-CI/CD-Pipeline für RAG-Anwendungen Richten Sie eine Pipeline für Continuous Integration (CI) und Continuous Deployment (CD) für RAG-Anwendungen ein.