RAG를 사용한 생성형 AI

다음 아키텍처 가이드를 참고하여 Google Cloud에서 검색 증강 생성(RAG)을 활용한 생성형 AI 애플리케이션을 설계하고 배포하세요.

아키텍처 가이드 설명
Gemini Enterprise 및 Vertex AI를 사용한 생성형 AI를 위한 RAG 인프라 실시간 데이터 가용성과 풍부한 문맥 검색이 필요한 엔터프라이즈 애플리케이션을 위해, Gemini Enterprise를 통합 플랫폼으로 사용하여 엔드 투 엔드 RAG 데이터 흐름을 오케스트레이션하는 에이전트 중심 아키텍처입니다.
Vertex AI 및 벡터 검색을 사용한 생성형 AI를 위한 RAG 인프라 대규모 애플리케이션을 위해 최적화된 고성능 벡터 검색 기능을 제공하는 완전 관리형 서버리스 아키텍처입니다.
Vertex AI 및 PostgreSQL용 AlloyDB를 사용한 생성형 AI를 위한 RAG 인프라 PostgreSQL용 AlloyDB와 같은 완전 관리형 데이터베이스에 운영 데이터와 함께 벡터 임베딩을 저장하는 아키텍처입니다.
점프 스타트 솔루션: Vertex AI 및 Cloud SQL을 사용한 생성형 AI RAG Cloud SQL과 같은 완전 관리형 데이터베이스에 운영 데이터와 함께 벡터 임베딩을 저장하는 아키텍처입니다.
GKE 및 Cloud SQL을 사용한 생성형 AI를 위한 RAG 인프라 Ray, Hugging Face, LangChain 등 오픈소스 도구를 활용해 커스텀 애플리케이션을 구축할 수 있는 최대 수준의 제어 기능을 제공하는 유연한 컨테이너 기반 아키텍처입니다.
Vertex AI 및 Spanner Graph를 사용한 생성형 AI를 위한 GraphRAG 인프라 벡터 검색과 지식 그래프 쿼리를 결합해 상호 연결된 문맥 데이터를 검색함으로써, 보다 세밀하고 관련성 높은 생성형 AI 응답을 제공하는 고급 RAG 아키텍처입니다.
RAG 애플리케이션을 위한 Harness CI/CD 파이프라인 Google Cloud환경에서 RAG 애플리케이션용 지속적 통합(CI) 및 지속적 배포(CD) 파이프라인을 위한 아키텍처입니다.