Anwendungsfall für generative KI: Personalisierte Produktempfehlungen erstellen

In diesem Dokument wird eine allgemeine Architektur für die Verwendung von KI zum Generieren personalisierter Produktempfehlungen für eine Einzelhandelsanwendung in Google Cloudbeschrieben.

Dieses Dokument richtet sich an Architekten, Entwickler und Administratoren, die generative KI-Anwendungen in der Cloud für die Einzelhandelsbranche entwickeln und verwalten. In diesem Dokument wird davon ausgegangen, dass Sie über ein grundlegendes Verständnis von generativer KI verfügen.

Architektur

Das folgende Diagramm zeigt eine Architektur, in der ein KI-Modell verwendet wird, um personalisierte Produktempfehlungen auf der Grundlage von Erkenntnissen aus Clickstream-Messwerten zu generieren.

Grafik: Architektur zur Verwendung von KI zum Generieren personalisierter Produktempfehlungen Grafik: Architektur zur Verwendung von KI zum Generieren personalisierter Produktempfehlungen}.

Die Architektur umfasst die folgenden Abläufe:

  • Nutzerdaten aufnehmen und verarbeiten:
    1. Clickstream-Daten wie Seitenaufrufe, Klicks und Käufe werden in eine Dataflow-Pipeline hochgeladen.
    2. Dataflow verarbeitet die Daten und leitet daraus Erkenntnisse wie Nutzerprofile und ‑präferenzen ab. Dataflow speichert dann die Daten, Statistiken und Vektoreinbettungen in BigQuery.
  • Produktempfehlungen generieren und bereitstellen:
    1. Ein Kunde besucht die Ladenfront des Unternehmens, die in dieser Architektur ein Cloud Run-Dienst ist.
    2. Der Storefront-Dienst sendet die Daten des Besuchers an einen Empfehlungsdienst, der in Cloud Run ausgeführt wird.
    3. Der Empfehlungsservice führt eine Suche nach Vektorähnlichkeit in BigQuery durch und ruft Daten zum Profil und zu den Einstellungen des Besuchers ab.
    4. Der Empfehlungsdienst sendet das Profil und die Einstellungen des Besuchers mit einem Prompt zur Generierung von Produktempfehlungen an die Gemini API in Vertex AI. Gemini generiert Produktempfehlungen, die auf den Besucher zugeschnitten sind.
    5. Der Empfehlungsdienst sendet die Produktempfehlungen an den Storefront-Dienst, der die Empfehlungen dann anzeigt.

Um Kosten und Leistung zu optimieren, fügen Sie einen Cache zwischen dem Storefront-Dienst und dem Empfehlungsdienst hinzu. Der Recommender-Dienst prüft den Cache auf Besucherdaten. Wenn der Cache keine relevanten Daten enthält, führt der Dienst eine Vektorähnlichkeitssuche in BigQuery durch. Zum Einrichten des Cache können Sie Memorystore verwenden oder einen Load Balancer mit Cloud CDN konfigurieren.

Verwendete Produkte

In dieser Beispielarchitektur werden die folgenden Google Cloud Produkte verwendet:

  • Cloud Run ist eine serverlose Computing-Plattform, mit der Sie Container direkt auf der skalierbaren Infrastruktur von Google ausführen können.
  • Vertex AI: Eine ML-Plattform, mit der Sie ML-Modelle und KI-Anwendungen trainieren und bereitstellen und LLMs für die Verwendung in KI-basierten Anwendungen anpassen können.
  • BigQuery: Ein Data Warehouse für Unternehmen, mit dem Sie Ihre Daten mit integrierten Features wie raumbezogenen Analysen für maschinelles Lernen und Business Intelligence verwalten und analysieren können.
  • Dataflow: Ein Dienst, der die einheitliche Verarbeitung großer Stream- und Batchdatenmengen ermöglicht.

Bereitstellung

Wenn Sie generative KI-Anwendungen in Google Cloud für Einzelhandelsarbeitslasten ausprobieren möchten, verwenden Sie die folgenden Codebeispiele:

Nächste Schritte

Beitragende

Autor: Kumar Dhanagopal | Cross-product Solution Developer

Weitere Beitragende: