Panduan arsitektur AI generatif

Last reviewed 2025-01-06 UTC

Dokumen di Pusat Arsitektur ini memberikan panduan arsitektur untuk membantu Anda membangun dan men-deploy workload AI generatif di Google Cloud.

Untuk mempelajari cara menyiapkan, men-deploy, mengevaluasi, dan mengoperasikan aplikasi AI generatif pada model dasar, lihat Men-deploy dan mengoperasikan aplikasi AI generatif.

Arsitektur tingkat tinggi

Panduan berikut memberikan arsitektur tingkat tinggi untuk kasus penggunaan bisnis dan teknis tertentu dari AI generatif:

Panduan Deskripsi
Membuat kampanye pemasaran yang dipersonalisasi Buat aset media untuk kampanye pemasaran yang dipersonalisasi.
Membuat rekomendasi produk yang dipersonalisasi Menghasilkan rekomendasi produk yang dipersonalisasi berdasarkan preferensi pengguna untuk aplikasi retail.
Membuat podcast dari file audio Membuat podcast berdasarkan file media seperti komentar live untuk acara olahraga.
Membuat solusi untuk permintaan dukungan pelanggan Membuat respons terhadap pertanyaan pelanggan, seperti permintaan dukungan teknologi.

Arsitektur referensi

Panduan berikut memberikan contoh arsitektur mendetail dan rekomendasi desain untuk men-deploy workload dan infrastruktur AI generatif untuk kasus penggunaan tertentu:

Panduan Deskripsi
Mengotomatiskan peninjauan penggunaan klaim asuransi Meningkatkan proses persetujuan awal (PA) dan peninjauan pemanfaatan (UR) untuk klaim asuransi kesehatan.
Infrastruktur RAG menggunakan Gemini Enterprise dan Vertex AI Atur alur kerja RAG berbasis agen dengan ketersediaan data real-time dan penelusuran kontekstual yang lebih baik.
Infrastruktur RAG menggunakan Vertex AI dan Vector Search Menyediakan penelusuran vektor yang dioptimalkan dan berperforma tinggi untuk aplikasi berskala besar.
Infrastruktur RAG menggunakan Vertex AI dan AlloyDB untuk PostgreSQL Simpan embedding vektor bersama data operasional dalam database AlloyDB untuk PostgreSQL yang terkelola sepenuhnya.
Infrastruktur RAG menggunakan Vertex AI dan Cloud SQL Menyimpan sematan vektor bersama data operasional dalam database Cloud SQL yang terkelola sepenuhnya.
Infrastruktur RAG menggunakan GKE dan Cloud SQL Bangun aplikasi RAG kustom menggunakan alat open source seperti Ray, Hugging Face, dan LangChain.
Infrastruktur GraphRAG menggunakan Vertex AI dan Spanner Graph Gabungkan penelusuran vektor dengan kueri grafik pengetahuan untuk pengambilan data kontekstual yang saling terhubung.
Konektivitas pribadi untuk aplikasi AI generatif berkemampuan RAG Amankan infrastruktur jaringan untuk aplikasi AI generatif berkemampuan RAG dengan menggunakan VPC Bersama.
Memanfaatkan pipeline CI/CD untuk aplikasi RAG Siapkan pipeline continuous integration (CI) dan continuous deployment (CD) untuk aplikasi RAG.