Dokumen ini menjelaskan arsitektur tingkat tinggi untuk menggunakan AI dalam membuat rekomendasi produk yang dipersonalisasi untuk aplikasi retail di Google Cloud.
Audiens yang dituju untuk dokumen ini mencakup arsitek, developer, dan administrator yang membangun dan mengelola aplikasi AI generatif di cloud untuk industri retail. Dokumen ini mengasumsikan bahwa Anda memiliki pemahaman dasar tentang AI generatif.
Arsitektur
Diagram berikut menunjukkan arsitektur yang menggunakan model AI untuk membuat rekomendasi produk yang dipersonalisasi berdasarkan insight dari metrik clickstream.
Arsitektur ini menampilkan alur berikut:
- Menyerap dan memproses data pengguna:
- Data clickstream seperti tayangan halaman, klik, dan pembelian diupload ke pipeline Dataflow.
- Dataflow memproses data dan memperoleh insight seperti profil dan preferensi pengguna. Dataflow kemudian menyimpan data, insight, dan penyematan vektor di BigQuery.
- Membuat dan menayangkan rekomendasi produk:
- Pelanggan mengunjungi etalase perusahaan, yang merupakan layanan Cloud Run dalam arsitektur ini.
- Layanan etalase mengirimkan data pengunjung ke layanan pemberi rekomendasi yang berjalan di Cloud Run.
- Layanan pemberi rekomendasi melakukan penelusuran kesamaan vektor di BigQuery dan mengambil data tentang profil dan preferensi pengunjung.
- Layanan pemberi rekomendasi mengirimkan data profil dan preferensi pengunjung ke Gemini API di Vertex AI, dengan perintah untuk membuat rekomendasi produk. Gemini membuat rekomendasi produk yang disesuaikan untuk pengunjung.
- Layanan pemberi rekomendasi mengirimkan rekomendasi produk ke layanan etalase, yang kemudian menampilkan rekomendasi tersebut.
Untuk mengoptimalkan biaya dan performa, tambahkan cache di antara layanan etalase dan layanan pemberi rekomendasi. Layanan pemberi rekomendasi memeriksa cache untuk data pengunjung. Jika cache tidak berisi data yang relevan, layanan akan melakukan penelusuran kesamaan vektor di BigQuery. Untuk menyiapkan cache, Anda dapat menggunakan Memorystore atau mengonfigurasi load balancer dengan Cloud CDN.
Produk yang digunakan
Arsitektur contoh ini menggunakan produk Google Cloud berikut:
- Cloud Run: Platform komputasi serverless yang memungkinkan Anda menjalankan container langsung di atas infrastruktur Google yang bersifat skalabel.
- Vertex AI: Platform ML yang memungkinkan Anda melatih dan men-deploy model ML dan aplikasi AI, serta menyesuaikan LLM untuk digunakan dalam aplikasi yang didukung AI.
- BigQuery: Data warehouse perusahaan yang membantu Anda mengelola dan menganalisis data dengan fitur bawaan seperti machine learning, analisis geospasial, dan business intelligence.
- Dataflow: Layanan yang menyediakan pemrosesan data batch dan streaming terpadu dalam skala besar.
Deployment
Untuk bereksperimen dengan aplikasi AI generatif di Google Cloud untuk beban kerja retail, gunakan contoh kode berikut:
Langkah berikutnya
- Jelajahi panduan arsitektur AI generatif lainnya.
- Untuk mengetahui ringkasan prinsip dan rekomendasi arsitektur khusus untuk workload AI dan ML di Google Cloud, lihat perspektif AI dan ML dalam Framework yang Dirancang dengan Baik.
- Untuk mengetahui lebih banyak tentang arsitektur referensi, diagram, dan praktik terbaik lainnya, jelajahi Pusat Arsitektur Cloud.
Kontributor
Penulis: Kumar Dhanagopal | Cross-Product Solution Developer
Kontributor lainnya:
- Amina Mansour | Head of Cloud Platform Evaluations Team
- Megan O'Keefe | Developer Advocate
- Samantha He | Technical Writer
- Shir Meir Lador | Developer Relations Engineering Manager