AI Generatif dengan RAG

Last reviewed 2025-09-22 UTC

Gunakan panduan arsitektur berikut untuk mendesain dan men-deploy aplikasi AI generatif dengan retrieval-augmented generation (RAG) di Google Cloud.

Panduan arsitektur	Deskripsi
Infrastruktur RAG untuk AI generatif menggunakan Gemini Enterprise dan Vertex AI	Arsitektur berbasis agen yang menggunakan Gemini Enterprise sebagai platform terpadu untuk mengatur alur data RAG end-to-end untuk aplikasi perusahaan yang memerlukan ketersediaan data real-time dan penelusuran kontekstual yang lebih baik.
Infrastruktur RAG untuk AI generatif menggunakan Vertex AI dan Vector Search	Arsitektur serverless yang terkelola sepenuhnya yang menyediakan penelusuran vektor berperforma tinggi dan dioptimalkan untuk aplikasi skala besar.
Infrastruktur RAG untuk AI generatif menggunakan Vertex AI dan AlloyDB untuk PostgreSQL	Arsitektur yang menyimpan embedding vektor bersama data operasional Anda dalam database yang terkelola sepenuhnya seperti AlloyDB untuk PostgreSQL.
Solusi Praktis: RAG AI Generatif menggunakan Vertex AI dan Cloud SQL	Arsitektur yang menyimpan penyematan vektor bersama data operasional Anda dalam database yang terkelola sepenuhnya seperti Cloud SQL.
Infrastruktur RAG untuk AI generatif menggunakan GKE dan Cloud SQL	Arsitektur berbasis container yang fleksibel dan memberikan kontrol maksimal untuk membangun aplikasi kustom dengan alat open source seperti Ray, Hugging Face, dan LangChain.
Infrastruktur GraphRAG untuk AI generatif menggunakan Vertex AI dan Spanner Graph	Arsitektur RAG canggih yang menggabungkan penelusuran vektor dengan kueri grafik pengetahuan untuk mengambil data kontekstual yang saling terhubung, sehingga menghasilkan respons AI generatif yang lebih mendetail dan relevan.
Memanfaatkan pipeline CI/CD untuk aplikasi RAG	Arsitektur untuk pipeline continuous integration (CI) dan continuous deployment (CD) untuk aplikasi RAG di Google Cloud.

Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.

Terakhir diperbarui pada 2025-09-22 UTC.