생성형 AI 아키텍처 가이드

Last reviewed 2025-01-06 UTC

아키텍처 센터의 이 문서에서는 Google Cloud에서 생성형 AI 워크로드를 빌드하고 배포하는 데 도움이 되는 아키텍처 가이드를 제공합니다.

파운데이션 모델에서 생성형 AI 애플리케이션을 설정, 배포, 평가, 운영하는 방법을 알아보려면 생성형 AI 애플리케이션 배포 및 운영을 참고하세요.

상위 수준 아키텍처

다음 가이드에서는 생성형 AI의 특정 비즈니스 및 기술 사용 사례에 대한 높은 수준의 아키텍처를 제공합니다.

가이드 설명
맞춤형 마케팅 캠페인 생성 맞춤형 마케팅 캠페인용 미디어 애셋을 생성합니다.
맞춤 제품 추천 생성 소매 애플리케이션을 위해 사용자 선호도를 기반으로 맞춤 제품 추천을 생성합니다.
오디오 파일에서 팟캐스트 생성 스포츠 이벤트의 라이브 해설과 같은 미디어 파일을 기반으로 팟캐스트를 생성합니다.
고객 지원 요청에 대한 해결책 생성 기술 지원 요청과 같은 고객 질문에 대한 응답을 생성합니다.

참조 아키텍처

다음 가이드에서는 특정 사용 사례에 맞게 생성형 AI 워크로드와 인프라를 배포하기 위한 자세한 아키텍처 예시와 설계 권장사항을 제공합니다.

가이드 설명
보험 청구의 활용도 검토 자동화 의료 보험 청구의 사전 승인 (PA) 및 사용률 검토 (UR) 프로세스를 개선합니다.
Gemini Enterprise 및 Vertex AI를 사용하는 RAG 인프라 실시간 데이터 가용성과 풍부한 문맥 검색을 통해 에이전트형 RAG 워크플로를 오케스트레이션합니다.
Vertex AI 및 벡터 검색을 사용하는 RAG 인프라 대규모 애플리케이션을 위해 최적화된 고성능 벡터 검색 기능을 제공합니다.
Vertex AI 및 PostgreSQL용 AlloyDB를 사용하는 RAG 인프라 완전 관리형 PostgreSQL용 AlloyDB 데이터베이스에 운영 데이터와 함께 벡터 임베딩을 저장합니다.
Vertex AI 및 Cloud SQL을 사용한 RAG 인프라 완전 관리형 Cloud SQL 데이터베이스에 운영 데이터와 함께 벡터 임베딩을 저장합니다.
GKE 및 Cloud SQL을 사용하는 RAG 인프라 Ray, Hugging Face, LangChain과 같은 오픈소스 도구를 사용하여 맞춤 RAG 애플리케이션을 빌드합니다.
Vertex AI 및 Spanner Graph를 사용하는 GraphRAG 인프라 벡터 검색과 지식 그래프 쿼리를 결합하여 상호 연결된 컨텍스트 데이터를 검색합니다.
RAG 지원 생성형 AI 애플리케이션의 비공개 연결 공유 VPC를 사용하여 RAG 지원 생성형 AI 애플리케이션의 네트워크 인프라를 보호합니다.
RAG 애플리케이션을 위한 Harness CI/CD 파이프라인 RAG 애플리케이션을 위한 지속적 통합 (CI) 및 지속적 배포 (CD) 파이프라인을 설정합니다.