Vertex AI RAG Engine은 RAG 인스턴스를 운영하기 위한 다양한 배포 모드를 제공합니다. 배포 모드 선택에 따라 데이터가 저장되는 위치, 데이터가 증가함에 따라 스토리지가 확장되는 방식, 필요한 인프라 관리 수준이 결정됩니다. 이러한 모드의 작동 방식을 이해하면 프로젝트에 적합한 단순성, 확장성, 비용의 균형을 선택할 수 있습니다.
Vertex AI RAG Engine은 서버리스와 Spanner라는 두 가지 배포 모드를 제공합니다. 두 모드 간에 원활하게 전환할 수 있습니다. 각 모드 내의 데이터는 다른 모드와 격리된 상태로 유지됩니다.
사용 가능한 배포 모드
이 섹션에서는 Vertex AI RAG Engine에 사용할 수 있는 두 가지 배포 모드를 설명합니다.
서버리스 모드
서버리스 모드는 Vertex AI RAG Engine을 시작하는 가장 저렴하고 권장되는 방법입니다. 모든 데이터베이스 프로비저닝과 확장성을 추상화하는 완전 관리형의 전 세계 규모 엔터프라이즈급 데이터베이스를 제공합니다.
- 적합한 대상: 대부분의 사용자, 빠른 온보딩, 인프라 구성을 관리할 필요 없이 원활한 확장
- 주요 기능: 등급 관리가 필요하지 않습니다. RAG 관리형 Vertex AI 벡터 검색을 기본 벡터 데이터베이스로 자동 사용하여 간소화된 즉시 사용 가능한 RAG 환경을 제공합니다.
서버리스 모드에서 RAG 관리 데이터베이스는 RAG 비즈니스 운영을 관리하고 RAG 리소스를 저장하는 데 사용됩니다. 이러한 리소스에는 RagCorpus, RagFiles, RagMetadata, DataSchema 등이 포함되지만 색인 생성 및 벡터 검색을 삽입하는 데는 더 이상 사용할 수 없습니다.
사용자는 항상 다른 벡터 데이터베이스를 별도로 선택해야 합니다. 서버리스 모드에서 Vertex AI RAG Engine은 기본적으로 임베딩 색인 생성 및 벡터 검색을 위해 프로젝트에 Vertex AI 벡터 검색 2.0 컬렉션을 프로비저닝합니다. Spanner 모드와 비교할 때 프로젝트에서 Vertex AI 벡터 검색 2.0을 프로비저닝하면 벡터 DB 사용량과 비용을 완전히 파악하고 제어할 수 있습니다. 자세한 비교는 Spanner 모드와 서버리스 모드 비교 섹션을 참고하세요.
Spanner 모드
Spanner 모드는 Vertex AI RAG Engine 배포의 기반으로 사용하기 위해 전용 Spanner 인프라를 할당합니다. CMEK와 같은 특정 규정 준수 기능이나 전용의 격리된 데이터베이스 인스턴스가 필요한 워크로드를 위해 설계되었습니다. 모드 선택이 명시적으로 선택되지 않으면 Spanner 모드가 기본값으로 할당됩니다.
Spanner 모드를 사용하는 경우 성능 등급을 선택하여 인프라를 관리해야 합니다.
- 기본 등급 (기본값): 실험, 소규모 데이터 크기 또는 지연 시간에 민감하지 않은 워크로드에 적합한 고정된 비용 효율적인 저사양 등급입니다.
- 확장 등급: 자동 확장 기능이 있는 프로덕션 규모의 성능을 제공합니다. 대용량 데이터 또는 성능에 민감한 워크로드를 가진 고객에게 적합합니다.
데이터 격리 및 모드 전환
Vertex AI RAG Engine을 사용하면 활성 배포 모드에서 진행 중인 작업이 없는 한 프로젝트의 배포 모드를 전환할 수 있습니다. 두 모드 모두에 데이터를 포함할 수 있습니다. 하지만 한 번에 하나의 모드만 활성화할 수 있으며 데이터는 배포 모드 간에 엄격하게 격리됩니다.
유용한 도구로 프로젝트가 완전히 분리된 두 개의 백엔드를 보유한 것처럼 작동한다고 상상해 보세요. 생성한 리소스 (코퍼스, 가져오고 업로드한 파일, 파싱된 삽입)는 생성 시 활성화된 배포 모드에 영구적으로 연결됩니다. 직접 또는 Gemini를 통해 이루어지는 모든 검색 요청도 현재 배포 모드에 있는 말뭉치 및 파일로 제한됩니다. 두 모드 간에 전환해도 데이터가 이동되거나 다른 모드의 데이터가 삭제되지는 않습니다.

다이어그램에 표시된 것처럼 다음과 같습니다.
- 통합 API: 동일한 Vertex AI RAG API를 사용하여 리소스를 만들고 관리합니다. API는 활성 배포 모드와 연결된 백엔드로 요청을 자동 라우팅합니다.
- 공개 상태: 서버리스 모드가 활성 상태인 경우 애플리케이션은 RagCorpus A 및 B만 보고 상호작용할 수 있습니다. Spanner 모드에서 생성된 RagCorpus C는 안전하게 저장되지만 프로젝트의 모드를 다시 Spanner로 전환할 때까지 완전히 숨겨져 애플리케이션에서 액세스할 수 없습니다.
- 데이터 손실 없음: 모드를 전환해도 데이터가 삭제되지 않습니다. API가 조회하는 '백엔드'만 변경됩니다.
배포 모드 관리
배포 모드는 프로젝트 수준 설정입니다. GetRagEngineConfig 및 UpdateRagEngineConfig API를 사용하여 현재 모드를 보거나 변경할 수 있습니다. 배포 모드 간 전환 및 Spanner 모드에 적합한 등급 선택에 관한 자세한 내용은 모드 간 전환 페이지를 참고하세요.
데이터 삭제 및 청구 중지
모드 간에 데이터가 격리되어 있으므로 리소스를 정리하고 청구를 중지하는 프로세스는 데이터가 있는 위치에 따라 약간 다릅니다.
- 서버리스 데이터를 삭제하려면 활성 모드가 서버리스로 설정되어 있는지 확인합니다.
ListRagCorporaAPI를 호출하여 리소스를 확인한 다음DeleteRagCorpusAPI를 사용하여 각 코퍼스를 수동으로 삭제합니다. - Spanner 데이터 삭제 (프로비저닝 해제): 활성 모드가 Spanner로 설정되어 있는지 확인합니다.
RagEngineConfig를 업데이트하고 Spanner 등급을Unprovisioned로 설정합니다. 이렇게 하면 전용 Spanner 인스턴스와 그 안에 저장된 모든 RAG 데이터가 즉시 삭제되고 Spanner 모드와 관련된 청구가 중지됩니다. 참고: 프로비저닝되지 않은 등급을 사용하여 삭제된 데이터는 복구할 수 없습니다.
Spanner 모드와 서버리스 모드의 비교
| 기능 | 서버리스 모드 | Spanner 모드 |
|---|---|---|
| 비용 |
|
|
| 확장 | 완전 관리형 자동 확장 | 등급을 선택해야 하지만 자동 확장 등급을 제공합니다. |
| 격리 | 스토리지가 격리되지 않음 | 스토리지 및 성능 격리를 제공합니다. |
| CMEK | 현재 CMEK 없음 | CMEK 지원 제공 |
| VPC 보안 제어 | 지원됨 | 지원됨 |
| 지원되는 벡터 DB |
|
|
다음 단계
- Vertex AI RAG Engine을 시작하려면 RAG 빠른 시작을 참고하세요.
- 배포 모드를 변경하거나 Spanner 모드의 등급을 업데이트하려면 모드 간 전환을 참고하세요.
- Spanner 인스턴스를 삭제하려면 프로비저닝되지 않음 등급으로 업데이트를 참고하세요.
- Spanner 모드에 대해 자세히 알아보려면 Spanner 모드 관리를 참고하세요.
- 서버리스 모드에 대해 자세히 알아보려면 서버리스 모드를 참고하세요.
- 가격 책정에 대해 알아보려면 Vertex AI RAG Engine 결제를 참고하세요.