Architekturleitfäden für generative KI

Last reviewed 2025-01-06 UTC

Dieses Dokument im Architecture Center enthält Architekturleitfäden, die Ihnen beim Erstellen und Bereitstellen von Arbeitslasten für generative KI in Google Cloudhelfen.

Informationen zum Einrichten, Bereitstellen, Bewerten und Ausführen von generativen KI-Anwendungen auf Foundation Models finden Sie unter Generative KI-Anwendungen bereitstellen und ausführen.

Allgemeine Architekturen

In den folgenden Leitfäden finden Sie allgemeine Architekturen für bestimmte geschäftliche und technische Anwendungsfälle von generativer KI:

Leitfaden	Beschreibung
Personalisierte Marketingkampagnen erstellen	Media-Assets für personalisierte Marketingkampagnen erstellen
Personalisierte Produktempfehlungen erstellen	Personalisierte Produktempfehlungen basierend auf Nutzerpräferenzen für Einzelhandelsanwendungen generieren
Podcasts aus Audiodateien erstellen	Podcasts basierend auf Media-Dateien wie Live-Kommentaren zu einem Sportereignis generieren
Lösungen für Kundensupportanfragen generieren	Antworten auf Kundenfragen generieren, z. B. Anfragen zum technischen Support.

Referenzarchitekturen

Die folgenden Leitfäden enthalten detaillierte Architekturbeispiele und Designempfehlungen für die Bereitstellung von Arbeitslasten und Infrastruktur für generative KI für bestimmte Anwendungsfälle:

Leitfaden	Beschreibung
Nutzungsüberprüfung von Versicherungsansprüchen automatisieren	Verbessern Sie den Prozess für die Vorabgenehmigung (Prior Authorization, PA) und die Überprüfung der Nutzung (Utilization Review, UR) für Krankenversicherungsansprüche.
RAG-Infrastruktur mit Gemini Enterprise und Vertex AI	Orchestrieren Sie einen agentischen RAG-Workflow mit Echtzeitdatenverfügbarkeit und erweiterter kontextbezogener Suche.
RAG-Infrastruktur mit Vertex AI und Vektorsuche	Optimierte, leistungsstarke Vektorsuche für Anwendungen im großen Maßstab.
RAG-Infrastruktur mit Vertex AI und AlloyDB for PostgreSQL	Vektoreinbettungen zusammen mit Betriebsdaten in einer vollständig verwalteten AlloyDB for PostgreSQL-Datenbank speichern.
RAG-Infrastruktur mit Vertex AI und Cloud SQL	Speichert Vektoreinbettungen zusammen mit Betriebsdaten in einer vollständig verwalteten Cloud SQL-Datenbank.
RAG-Infrastruktur mit GKE und Cloud SQL	Benutzerdefinierte RAG-Anwendungen mit Open-Source-Tools wie Ray, Hugging Face und LangChain erstellen.
GraphRAG-Infrastruktur mit Vertex AI und Spanner Graph	Kombinieren Sie die Vektorsuche mit Knowledge Graph-Abfragen, um miteinander verbundene Kontextdaten abzurufen.
Private Verbindungen für RAG-fähige generative KI-Anwendungen	Sichern Sie die Netzwerkinfrastruktur für RAG-fähige generative KI-Anwendungen mit freigegebene VPC.
Harness-CI/CD-Pipeline für RAG-Anwendungen	Richten Sie eine Pipeline für Continuous Integration (CI) und Continuous Deployment (CD) für RAG-Anwendungen ein.

Architekturleitfäden für generative KI Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Allgemeine Architekturen

Referenzarchitekturen

Architekturleitfäden für generative KI