このドキュメントでは、 Google Cloudの小売アプリケーションで AI を使用してパーソナライズされた商品のおすすめを生成するためのアーキテクチャの概要について説明します。
このドキュメントは、小売業界向けにクラウドで生成 AI アプリケーションを構築して管理するアーキテクト、デベロッパー、管理者を対象としています。このドキュメントは、生成 AI の基本的な知識があることを前提としています。
アーキテクチャ
次の図は、AI モデルを使用してクリックストリーム指標の分析情報に基づいてパーソナライズされた商品のおすすめを生成するアーキテクチャを示しています。
このアーキテクチャは次のフローを示しています。
- ユーザーデータの取り込みと処理:
- ページビュー、クリック数、購入数などのクリックストリーム データが Dataflow パイプラインにアップロードされます。
- Dataflow はデータを処理し、ユーザー プロファイルや設定などの分析情報を導き出します。Dataflow は、データ、分析情報、ベクトル エンベディングを BigQuery に保存します。
- おすすめ商品を生成して配信する:
- 顧客が会社のストアフロントにアクセスします。このアーキテクチャでは、ストアフロントは Cloud Run サービスです。
- ストアフロント サービスは、Cloud Run で実行されているレコメンダー サービスに訪問者のデータを送信します。
- レコメンダー サービスは、BigQuery でベクトル類似検索を実行し、サイト訪問者のプロファイルと設定に関するデータを取得します。
- レコメンデーション サービスは、訪問者のプロフィールと設定のデータを Vertex AI の Gemini API に送信し、商品のおすすめを生成するようプロンプトを送信します。Gemini は、サイト訪問者に合わせたおすすめ商品を生成します。
- レコメンデーション サービスは、おすすめ商品をストアフロント サービスに送信します。ストアフロント サービスは、おすすめ商品を表示します。
費用とパフォーマンスを最適化するには、ストアフロント サービスとレコメンダー サービスの間にキャッシュを追加します。Recommender サービスは、キャッシュで訪問者データをチェックします。キャッシュに関連データが含まれていない場合、サービスは BigQuery でベクトル類似検索を実行します。キャッシュを設定するには、Memorystore を使用するか、Cloud CDN でロードバランサを構成します。
使用するプロダクト
このアーキテクチャ例では、次の Google Cloud プロダクトを使用します。
- Cloud Run: Google のスケーラブルなインフラストラクチャ上でコンテナを直接実行できるマネージド コンピューティング プラットフォーム。
- Vertex AI: ML モデルと AI アプリケーションのトレーニングとデプロイを行い、AI を活用したアプリケーションで使用する LLM をカスタマイズできる ML プラットフォーム。
- BigQuery: ML、地理空間分析、ビジネス インテリジェンスなどの組み込み機能を使用してデータの管理と分析を支援する、Google Cloud のフルマネージド エンタープライズ データ ウェアハウス。
- Dataflow: 統合されたストリーム データ処理とバッチデータ処理を大規模に提供するサービス。
デプロイ
小売業のワークロード用の Google Cloud で生成 AI アプリケーションを試すには、次のコードサンプルを使用します。
次のステップ
- その他の生成 AI アーキテクチャ ガイドを確認する。
- Google Cloudの AI ワークロードと ML ワークロードに固有のアーキテクチャ原則と推奨事項の概要について、Well-Architected Framework の AI と ML の視点を確認する。
- Cloud アーキテクチャ センターで、リファレンス アーキテクチャ、図、ベスト プラクティスを確認する。
協力者
著者: Kumar Dhanagopal | クロスプロダクト ソリューション デベロッパー
その他の寄稿者:
- Amina Mansour | Cloud Platform 評価チームの責任者
- Megan O'Keefe | デベロッパー アドボケイト
- Samantha He | テクニカル ライター
- Shir Meir Lador | デベロッパー リレーションズ エンジニアリング マネージャー