Last reviewed 2025-01-06 UTC
아키텍처 센터의 이 문서에서는 Google Cloud에서 생성형 AI 워크로드를 빌드하고 배포하는 데 도움이 되는 아키텍처 가이드를 제공합니다.
파운데이션 모델에서 생성형 AI 애플리케이션을 설정, 배포, 평가, 운영하는 방법을 알아보려면 생성형 AI 애플리케이션 배포 및 운영을 참고하세요.
상위 수준 아키텍처
다음 가이드에서는 생성형 AI의 특정 비즈니스 및 기술 사용 사례에 대한 높은 수준의 아키텍처를 제공합니다.
| 가이드 | 설명 |
|---|---|
| 맞춤형 마케팅 캠페인 생성 | 맞춤형 마케팅 캠페인용 미디어 애셋을 생성합니다. |
| 맞춤 제품 추천 생성 | 소매 애플리케이션을 위해 사용자 선호도를 기반으로 맞춤 제품 추천을 생성합니다. |
| 오디오 파일에서 팟캐스트 생성 | 스포츠 이벤트의 라이브 해설과 같은 미디어 파일을 기반으로 팟캐스트를 생성합니다. |
| 고객 지원 요청에 대한 해결책 생성 | 기술 지원 요청과 같은 고객 질문에 대한 응답을 생성합니다. |
참조 아키텍처
다음 가이드에서는 특정 사용 사례에 맞게 생성형 AI 워크로드와 인프라를 배포하기 위한 자세한 아키텍처 예시와 설계 권장사항을 제공합니다.
| 가이드 | 설명 |
|---|---|
| 보험 청구의 활용도 검토 자동화 | 의료 보험 청구의 사전 승인 (PA) 및 사용률 검토 (UR) 프로세스를 개선합니다. |
| Gemini Enterprise 및 Vertex AI를 사용하는 RAG 인프라 | 실시간 데이터 가용성과 풍부한 문맥 검색을 통해 에이전트형 RAG 워크플로를 오케스트레이션합니다. |
| Vertex AI 및 벡터 검색을 사용하는 RAG 인프라 | 대규모 애플리케이션을 위해 최적화된 고성능 벡터 검색 기능을 제공합니다. |
| Vertex AI 및 PostgreSQL용 AlloyDB를 사용하는 RAG 인프라 | 완전 관리형 PostgreSQL용 AlloyDB 데이터베이스에 운영 데이터와 함께 벡터 임베딩을 저장합니다. |
| Vertex AI 및 Cloud SQL을 사용한 RAG 인프라 | 완전 관리형 Cloud SQL 데이터베이스에 운영 데이터와 함께 벡터 임베딩을 저장합니다. |
| GKE 및 Cloud SQL을 사용하는 RAG 인프라 | Ray, Hugging Face, LangChain과 같은 오픈소스 도구를 사용하여 맞춤 RAG 애플리케이션을 빌드합니다. |
| Vertex AI 및 Spanner Graph를 사용하는 GraphRAG 인프라 | 벡터 검색과 지식 그래프 쿼리를 결합하여 상호 연결된 컨텍스트 데이터를 검색합니다. |
| RAG 지원 생성형 AI 애플리케이션의 비공개 연결 | 공유 VPC를 사용하여 RAG 지원 생성형 AI 애플리케이션의 네트워크 인프라를 보호합니다. |
| RAG 애플리케이션을 위한 Harness CI/CD 파이프라인 | RAG 애플리케이션을 위한 지속적 통합 (CI) 및 지속적 배포 (CD) 파이프라인을 설정합니다. |