다음 아키텍처 가이드를 참고하여 Google Cloud에서 검색 증강 생성(RAG)을 활용한 생성형 AI 애플리케이션을 설계하고 배포하세요.
| 아키텍처 가이드 | 설명 |
|---|---|
| Gemini Enterprise 및 Vertex AI를 사용한 생성형 AI를 위한 RAG 인프라 | 실시간 데이터 가용성과 풍부한 문맥 검색이 필요한 엔터프라이즈 애플리케이션을 위해, Gemini Enterprise를 통합 플랫폼으로 사용하여 엔드 투 엔드 RAG 데이터 흐름을 오케스트레이션하는 에이전트 중심 아키텍처입니다. |
| Vertex AI 및 벡터 검색을 사용한 생성형 AI를 위한 RAG 인프라 | 대규모 애플리케이션을 위해 최적화된 고성능 벡터 검색 기능을 제공하는 완전 관리형 서버리스 아키텍처입니다. |
| Vertex AI 및 PostgreSQL용 AlloyDB를 사용한 생성형 AI를 위한 RAG 인프라 | PostgreSQL용 AlloyDB와 같은 완전 관리형 데이터베이스에 운영 데이터와 함께 벡터 임베딩을 저장하는 아키텍처입니다. |
| 점프 스타트 솔루션: Vertex AI 및 Cloud SQL을 사용한 생성형 AI RAG | Cloud SQL과 같은 완전 관리형 데이터베이스에 운영 데이터와 함께 벡터 임베딩을 저장하는 아키텍처입니다. |
| GKE 및 Cloud SQL을 사용한 생성형 AI를 위한 RAG 인프라 | Ray, Hugging Face, LangChain 등 오픈소스 도구를 활용해 커스텀 애플리케이션을 구축할 수 있는 최대 수준의 제어 기능을 제공하는 유연한 컨테이너 기반 아키텍처입니다. |
| Vertex AI 및 Spanner Graph를 사용한 생성형 AI를 위한 GraphRAG 인프라 | 벡터 검색과 지식 그래프 쿼리를 결합해 상호 연결된 문맥 데이터를 검색함으로써, 보다 세밀하고 관련성 높은 생성형 AI 응답을 제공하는 고급 RAG 아키텍처입니다. |
| RAG 애플리케이션을 위한 Harness CI/CD 파이프라인 | Google Cloud환경에서 RAG 애플리케이션용 지속적 통합(CI) 및 지속적 배포(CD) 파이프라인을 위한 아키텍처입니다. |