Panduan arsitektur AI generatif

Last reviewed 2025-01-06 UTC

Dokumen di Pusat Arsitektur ini memberikan panduan arsitektur untuk membantu Anda membangun dan men-deploy workload AI generatif di Google Cloud.

Untuk mempelajari cara menyiapkan, men-deploy, mengevaluasi, dan mengoperasikan aplikasi AI generatif pada model dasar, lihat Men-deploy dan mengoperasikan aplikasi AI generatif.

Arsitektur tingkat tinggi

Panduan berikut memberikan arsitektur tingkat tinggi untuk kasus penggunaan bisnis dan teknis tertentu dari AI generatif:

Panduan	Deskripsi
Membuat kampanye pemasaran yang dipersonalisasi	Buat aset media untuk kampanye pemasaran yang dipersonalisasi.
Membuat rekomendasi produk yang dipersonalisasi	Menghasilkan rekomendasi produk yang dipersonalisasi berdasarkan preferensi pengguna untuk aplikasi retail.
Membuat podcast dari file audio	Membuat podcast berdasarkan file media seperti komentar live untuk acara olahraga.
Membuat solusi untuk permintaan dukungan pelanggan	Membuat respons terhadap pertanyaan pelanggan, seperti permintaan dukungan teknologi.

Arsitektur referensi

Panduan berikut memberikan contoh arsitektur mendetail dan rekomendasi desain untuk men-deploy workload dan infrastruktur AI generatif untuk kasus penggunaan tertentu:

Panduan	Deskripsi
Mengotomatiskan peninjauan penggunaan klaim asuransi	Meningkatkan proses persetujuan awal (PA) dan peninjauan pemanfaatan (UR) untuk klaim asuransi kesehatan.
Infrastruktur RAG menggunakan Gemini Enterprise dan Vertex AI	Atur alur kerja RAG berbasis agen dengan ketersediaan data real-time dan penelusuran kontekstual yang lebih baik.
Infrastruktur RAG menggunakan Vertex AI dan Vector Search	Menyediakan penelusuran vektor yang dioptimalkan dan berperforma tinggi untuk aplikasi berskala besar.
Infrastruktur RAG menggunakan Vertex AI dan AlloyDB untuk PostgreSQL	Simpan embedding vektor bersama data operasional dalam database AlloyDB untuk PostgreSQL yang terkelola sepenuhnya.
Infrastruktur RAG menggunakan Vertex AI dan Cloud SQL	Menyimpan sematan vektor bersama data operasional dalam database Cloud SQL yang terkelola sepenuhnya.
Infrastruktur RAG menggunakan GKE dan Cloud SQL	Bangun aplikasi RAG kustom menggunakan alat open source seperti Ray, Hugging Face, dan LangChain.
Infrastruktur GraphRAG menggunakan Vertex AI dan Spanner Graph	Gabungkan penelusuran vektor dengan kueri grafik pengetahuan untuk pengambilan data kontekstual yang saling terhubung.
Konektivitas pribadi untuk aplikasi AI generatif berkemampuan RAG	Amankan infrastruktur jaringan untuk aplikasi AI generatif berkemampuan RAG dengan menggunakan VPC Bersama.
Memanfaatkan pipeline CI/CD untuk aplikasi RAG	Siapkan pipeline continuous integration (CI) dan continuous deployment (CD) untuk aplikasi RAG.

Panduan arsitektur AI generatif Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Arsitektur tingkat tinggi

Arsitektur referensi

Panduan arsitektur AI generatif