Gunakan panduan arsitektur berikut untuk mendesain dan men-deploy aplikasi AI generatif dengan retrieval-augmented generation (RAG) di Google Cloud.
| Panduan arsitektur | Deskripsi |
|---|---|
| Infrastruktur RAG untuk AI generatif menggunakan Gemini Enterprise dan Vertex AI | Arsitektur berbasis agen yang menggunakan Gemini Enterprise sebagai platform terpadu untuk mengatur alur data RAG end-to-end untuk aplikasi perusahaan yang memerlukan ketersediaan data real-time dan penelusuran kontekstual yang lebih baik. |
| Infrastruktur RAG untuk AI generatif menggunakan Vertex AI dan Vector Search | Arsitektur serverless yang terkelola sepenuhnya yang menyediakan penelusuran vektor berperforma tinggi dan dioptimalkan untuk aplikasi skala besar. |
| Infrastruktur RAG untuk AI generatif menggunakan Vertex AI dan AlloyDB untuk PostgreSQL | Arsitektur yang menyimpan embedding vektor bersama data operasional Anda dalam database yang terkelola sepenuhnya seperti AlloyDB untuk PostgreSQL. |
| Solusi Praktis: RAG AI Generatif menggunakan Vertex AI dan Cloud SQL | Arsitektur yang menyimpan penyematan vektor bersama data operasional Anda dalam database yang terkelola sepenuhnya seperti Cloud SQL. |
| Infrastruktur RAG untuk AI generatif menggunakan GKE dan Cloud SQL | Arsitektur berbasis container yang fleksibel dan memberikan kontrol maksimum untuk membangun aplikasi kustom dengan alat open source seperti Ray, Hugging Face, dan LangChain. |
| Infrastruktur GraphRAG untuk AI generatif menggunakan Vertex AI dan Spanner Graph | Arsitektur RAG canggih yang menggabungkan penelusuran vektor dengan kueri grafik pengetahuan untuk mengambil data kontekstual yang saling terhubung, sehingga menghasilkan respons AI generatif yang lebih mendetail dan relevan. |
| Memanfaatkan pipeline CI/CD untuk aplikasi RAG | Arsitektur untuk pipeline continuous integration (CI) dan continuous deployment (CD) untuk aplikasi RAG di Google Cloud. |