Dokumen di Pusat Arsitektur ini memberikan panduan arsitektur untuk membantu Anda membangun dan men-deploy workload AI generatif di Google Cloud.
Untuk mempelajari cara menyiapkan, men-deploy, mengevaluasi, dan mengoperasikan aplikasi AI generatif pada model dasar, lihat Men-deploy dan mengoperasikan aplikasi AI generatif.
Arsitektur tingkat tinggi
Panduan berikut memberikan arsitektur tingkat tinggi untuk kasus penggunaan bisnis dan teknis tertentu dari AI generatif:
| Panduan | Deskripsi |
|---|---|
| Membuat kampanye pemasaran yang dipersonalisasi | Buat aset media untuk kampanye pemasaran yang dipersonalisasi. |
| Membuat rekomendasi produk yang dipersonalisasi | Menghasilkan rekomendasi produk yang dipersonalisasi berdasarkan preferensi pengguna untuk aplikasi retail. |
| Membuat podcast dari file audio | Membuat podcast berdasarkan file media seperti komentar live untuk acara olahraga. |
| Membuat solusi untuk permintaan dukungan pelanggan | Membuat respons terhadap pertanyaan pelanggan, seperti permintaan dukungan teknologi. |
Arsitektur referensi
Panduan berikut memberikan contoh arsitektur mendetail dan rekomendasi desain untuk men-deploy workload dan infrastruktur AI generatif untuk kasus penggunaan tertentu:
| Panduan | Deskripsi |
|---|---|
| Mengotomatiskan peninjauan penggunaan klaim asuransi | Meningkatkan proses persetujuan awal (PA) dan peninjauan pemanfaatan (UR) untuk klaim asuransi kesehatan. |
| Infrastruktur RAG menggunakan Gemini Enterprise dan Vertex AI | Atur alur kerja RAG berbasis agen dengan ketersediaan data real-time dan penelusuran kontekstual yang lebih baik. |
| Infrastruktur RAG menggunakan Vertex AI dan Vector Search | Menyediakan penelusuran vektor yang dioptimalkan dan berperforma tinggi untuk aplikasi berskala besar. |
| Infrastruktur RAG menggunakan Vertex AI dan AlloyDB untuk PostgreSQL | Simpan embedding vektor bersama data operasional dalam database AlloyDB untuk PostgreSQL yang terkelola sepenuhnya. |
| Infrastruktur RAG menggunakan Vertex AI dan Cloud SQL | Menyimpan sematan vektor bersama data operasional dalam database Cloud SQL yang terkelola sepenuhnya. |
| Infrastruktur RAG menggunakan GKE dan Cloud SQL | Bangun aplikasi RAG kustom menggunakan alat open source seperti Ray, Hugging Face, dan LangChain. |
| Infrastruktur GraphRAG menggunakan Vertex AI dan Spanner Graph | Gabungkan penelusuran vektor dengan kueri grafik pengetahuan untuk pengambilan data kontekstual yang saling terhubung. |
| Konektivitas pribadi untuk aplikasi AI generatif berkemampuan RAG | Amankan infrastruktur jaringan untuk aplikasi AI generatif berkemampuan RAG dengan menggunakan VPC Bersama. |
| Memanfaatkan pipeline CI/CD untuk aplikasi RAG | Siapkan pipeline continuous integration (CI) dan continuous deployment (CD) untuk aplikasi RAG. |