생성형 AI 사용 사례: 맞춤 제품 추천 생성

이 문서에서는 Google Cloud에서 AI를 사용하여 소매 애플리케이션을 위한 맞춤형 제품 추천을 생성하는 대략적인 아키텍처를 설명합니다.

이 문서의 주요 대상에는 소매업계를 위해 클라우드에서 생성형 AI 애플리케이션을 빌드하고 관리하는 설계자, 개발자, 관리자가 포함됩니다. 이 문서에서는 생성형 AI에 대한 기본적인 이해가 있다고 가정합니다.

아키텍처

다음 다이어그램은 AI 모델을 사용하여 클릭스트림 측정항목의 통계를 기반으로 맞춤형 제품 추천을 생성하는 아키텍처를 보여줍니다.

AI를 사용하여 맞춤 제품 추천을 생성하는 아키텍처 AI를 사용하여 맞춤 제품 추천을 생성하는 아키텍처

아키텍처는 다음 흐름을 보여줍니다.

  • 사용자 데이터 수집 및 처리:
    1. 페이지 조회수, 클릭수, 구매와 같은 클릭 스트림 데이터가 Dataflow 파이프라인에 업로드됩니다.
    2. Dataflow는 데이터를 처리하고 사용자 프로필 및 선호도와 같은 유용한 정보를 도출합니다. 그런 다음 Dataflow는 데이터, 통계, 벡터 삽입을 BigQuery에 저장합니다.
  • 제품 추천 생성 및 게재:
    1. 고객이 회사의 스토어(이 아키텍처에서는 Cloud Run 서비스)를 방문합니다.
    2. 스토어 서비스는 Cloud Run에서 실행되는 추천자 서비스로 방문자의 데이터를 전송합니다.
    3. 추천 서비스는 BigQuery에서 벡터 유사성 검색을 실행하고 방문자의 프로필 및 환경설정에 관한 데이터를 가져옵니다.
    4. 추천 서비스는 방문자의 프로필 및 환경설정 데이터를 Vertex AI의 Gemini API에 전송하고 제품 추천을 생성하라는 프롬프트를 전송합니다. Gemini는 방문자에게 맞춤설정된 제품 추천을 생성합니다.
    5. 추천 서비스는 제품 추천을 스토어 서비스로 전송하고, 스토어 서비스는 추천을 표시합니다.

비용과 성능을 최적화하려면 스토어 서비스와 추천자 서비스 사이에 캐시를 추가하세요. 추천 서비스는 캐시에서 방문자 데이터를 확인합니다. 캐시에 관련 데이터가 포함되어 있지 않으면 서비스에서 BigQuery에서 벡터 유사성 검색을 실행합니다. 캐시를 설정하려면 Memorystore를 사용하거나 Cloud CDN으로 부하 분산기를 구성하면 됩니다.

사용 제품

이 예시 아키텍처에는 다음과 같은 Google Cloud 제품이 사용됩니다.

  • Cloud Run: Google의 확장 가능한 인프라에서 직접 컨테이너를 실행할 수 있게 해주는 서버리스 컴퓨팅 플랫폼입니다.
  • Vertex AI: ML 모델 및 AI 애플리케이션을 학습 및 배포하고 AI 기반 애플리케이션에서 사용하도록 LLM을 맞춤설정할 수 있게 해주는 ML 플랫폼입니다.
  • BigQuery: 머신러닝 지리 정보 분석 및 비즈니스 인텔리전스와 같은 기본 제공 기능으로 데이터를 관리 및 분석하는 데 도움이 되는 엔터프라이즈 데이터 웨어하우스입니다.
  • Dataflow: 통합 스트림 및 일괄 데이터 처리를 대규모로 제공하는 서비스입니다.

배포

소매 워크로드용 Google Cloud 생성형 AI 애플리케이션을 실험하려면 다음 코드 샘플을 사용하세요.

다음 단계

  • 생성형 AI 아키텍처 가이드를 자세히 살펴보세요.
  • Google Cloud에서 AI 및 ML 워크로드와 관련된 아키텍처 원칙 및 권장사항에 대한 개요는 Well-Architected Framework의 AI 및 ML 관점을 참조하세요.
  • 그 밖의 참조 아키텍처, 다이어그램, 튜토리얼, 권장사항을 알아보려면 Cloud 아키텍처 센터를 확인하세요.

참여자

저자: 쿠마르 다나고팔 | 크로스 프로덕트 솔루션 개발자

기타 참여자: