검색 증강 생성(RAG)을 사용하여 조직의 데이터를 기반으로 그라운딩되고 정확한 대답을 제공하는 생성형 AI 채팅 애플리케이션을 빌드합니다. 이 가이드에서는 고유한 요구사항에 맞게 맞춤설정하고 애플리케이션으로 배포할 수 있는 Cloud SQL을 사용한 생성형 AI RAG 애플리케이션 템플릿을 설명합니다.
예를 들어 다음 비즈니스 요구사항을 해결하기 위해 이 템플릿을 구현할 수 있습니다.
| 예 | 비즈니스 요구 | 구현 |
|---|---|---|
| 고객 지원 챗봇 | 기업은 즉각적인 고객 지원을 제공해야 합니다. | Cloud Run에서 채팅 인터페이스를 호스팅합니다. Vertex AI는 임베딩을 처리하고 Cloud SQL에 벡터로 저장된 기술 문서를 기반으로 응답을 생성합니다. |
| 내부 HR 어시스턴트 | 직원이 복리후생, 회사 정책, 내부 절차에 관한 정보를 찾아야 하는 경우 | Cloud Run에서 HR 어시스턴트를 호스팅합니다. 직원이 도구에 질문하면 Vertex AI가 Cloud SQL에서 관련 정책 정보를 검색하여 정확하고 소스에 기반한 대답을 생성합니다. |
| 법률 문서 연구원 | 법무팀은 대규모 문서 저장소에서 관련 판례 또는 계약 조항을 신속하게 찾아야 합니다. | Cloud Run에서 연구 포털을 호스팅합니다. Vertex AI는 Cloud SQL에 벡터로 저장된 법률 문서를 사용하여 관련 선례를 요약하고 계약의 특정 문구를 식별합니다. |
| 시맨틱 제품 검색 | 전자상거래 회사는 정확한 키워드 대신 자연어 설명을 사용하여 제품 검색을 용이하게 하고자 합니다. | Cloud Run에서 검색 인터페이스를 호스팅합니다. Vertex AI는 사용자 설명을 처리하여 Cloud SQL에 벡터로 저장된 제품 카탈로그에서 의미상 가장 관련성 높은 제품을 반환합니다. |
아키텍처
다음 이미지는 애플리케이션의 구성요소와 연결을 보여줍니다.
다음은 애플리케이션의 요청 처리 흐름입니다.
- Cloud SQL의 PostgreSQL 데이터베이스에 데이터를 로드합니다.
- Vertex AI는 텍스트 필드의 임베딩을 생성하고 데이터베이스에 벡터로 저장합니다.
- Cloud Load Balancing 프런트엔드는 외부 요청을 수신하고 트래픽을 Cloud Load Balancing 백엔드로 분산합니다.
- Cloud Load Balancing 백엔드는 트래픽을 Cloud Run 프런트엔드 서비스로 분산합니다.
- 생성형 AI 호출을 위해 프런트엔드 서비스가 검색 서비스와 통신합니다.
- 검색 서비스는 Secret Manager를 사용하여 Vertex AI 및 Cloud SQL에 액세스하는 데 필요한 API 키와 사용자 인증 정보에 안전하게 액세스합니다.
- 검색 서비스는 요청을 임베딩으로 변환하고 Cloud SQL 데이터베이스에서 유사한 벡터를 검색합니다.
- 검색 서비스는 검색 결과를 원본 프롬프트와 함께 Vertex AI로 전송하여 대답을 생성합니다.
다음 단계
- 이 템플릿을 배포하거나 복제하는 방법을 알아보세요.
- 구체적인 요구사항에 맞게 템플릿을 맞춤설정하는 방법을 이해합니다.
- Google Cloud 아키텍처 프레임워크에서 일반적인 아키텍처 권장사항을 확인합니다.