Gemini Enterprise Agent Platform의 RAG Engine은 RAG 인스턴스를 운영하기 위한 다양한 배포 모드를 제공합니다. 선택한 배포 모드에 따라 데이터가 저장되는 위치, 데이터 증가에 따라 스토리지 확장되는 방식, 필요한 인프라 관리 수준이 결정됩니다. 이러한 모드가 작동하는 방식을 이해하면 프로젝트에 적합한 단순성, 확장성, 비용의 균형을 선택할 수 있습니다.
RAG Engine은 서버리스와 Spanner라는 두 가지 배포 모드를 제공합니다. 두 모드 간에 원활하게 전환할 수 있습니다. 각 모드 내의 데이터는 서로 격리된 상태로 유지됩니다.
사용 가능한 배포 모드
이 섹션에서는 RAG Engine에 사용할 수 있는 두 가지 배포 모드에 대해 설명합니다.
서버리스 모드
서버리스 모드는 RAG Engine을 시작할 때 가장 저렴하고 권장되는 방법입니다. 모든 데이터베이스 프로비저닝 및 확장을 추상화하는 완전 관리형의 전 세계 규모의 엔터프라이즈급 데이터베이스를 제공합니다.
- 최적의 사용 사례: 대부분의 사용자, 빠른 온보딩, 인프라 구성을 관리할 필요 없는 원활한 확장
- 주요 기능: 등급 관리가 필요하지 않습니다. RAG 관리형 벡터 검색을 기본 벡터 데이터베이스로 자동 사용하여 간소화된 즉시 사용 가능한 RAG 환경을 제공합니다.
서버리스 모드에서 RAG 관리형 데이터베이스는 RAG 비즈니스 운영을 관리하고 RAG 리소스를 저장하는 데 사용됩니다. 이러한 리소스에는 RagCorpus, RagFiles, RagMetadata, DataSchema 등이 포함되지만 임베딩 색인 생성 및 벡터 검색에는 더 이상 사용할 수 없습니다.
사용자는 항상 별도로 다른 벡터 데이터베이스를 선택해야 합니다. 서버리스 모드에서 RAG Engine은 기본적으로 임베딩 색인 생성 및 벡터 검색을 위해 프로젝트에 벡터 검색 2.0 컬렉션을 프로비저닝합니다. Spanner 모드와 비교할 때 프로젝트에서 벡터 검색 2.0을 프로비저닝하면 벡터 DB 사용량과 비용을 완전히 파악하고 제어할 수 있습니다. 자세한 비교는 Spanner 모드와 서버리스 모드 섹션을 참고하세요.
Spanner 모드
Spanner 모드는 RAG Engine 배포의 기반 역할을 하도록 전용 Spanner 인프라를 할당합니다. CMEK와 같은 특정 규정 준수 기능 또는 전용 격리 데이터베이스 인스턴스가 필요한 워크로드용으로 설계되었습니다. 모드 선택이 명시적으로 선택되지 않은 경우 Spanner 모드가 기본값으로 할당됩니다.
Spanner 모드를 사용하는 경우 성능 등급을 선택하여 인프라를 관리해야 합니다.
- 기본 등급 (기본값): 실험, 소규모 데이터 크기 또는 지연 시간에 민감하지 않은 워크로드에 적합한 고정된 비용 효율적인 저사양 등급입니다.
- 확장 등급: 자동 확장 기능이 있는 프로덕션 규모의 성능을 제공합니다. 대용량 데이터 또는 성능에 민감한 워크로드를 가진 고객에게 적합합니다.
데이터 격리 및 모드 전환
RAG Engine을 사용하면 활성 배포 모드에서 진행 중인 작업이 없는 한 프로젝트의 배포 모드를 전환할 수 있습니다. 두 모드 모두에서 데이터를 사용할 수 있습니다. 하지만 한 번에 하나의 모드만 활성화할 수 있으며 데이터는 배포 모드 간에 엄격하게 격리됩니다.
유용한 도구로 프로젝트가 완전히 별개의 두 백엔드를 가진 것처럼 동작한다고 생각할 수 있습니다. 생성하는 리소스 (코퍼스, 가져온 파일, 업로드된 파일, 파싱된 임베딩)는 생성 중에 활성 상태였던 배포 모드에 영구적으로 연결됩니다. 직접 또는 Gemini를 통한 모든 검색 요청도 현재 배포 모드에 있는 코퍼스와 파일로 제한됩니다. 두 모드 간에 전환해도 데이터가 이동하거나 다른 모드에서 데이터가 삭제되지 않습니다.

다이어그램에 표시된 대로
- 통합 API: 정확히 동일한 Agent Platform RAG API를 사용하여 리소스를 만들고 관리합니다. API는 활성 배포 모드와 연결된 백엔드로 요청을 자동으로 라우팅합니다.
- 가시성: 서버리스 모드가 활성 상태이면 애플리케이션은 RagCorpus A 및 B만 보고 상호작용할 수 있습니다. Spanner 모드에서 생성된 RagCorpus C는 안전하게 저장된 상태로 유지되지만 프로젝트의 모드를 다시 Spanner로 전환할 때까지 애플리케이션에 완전히 숨겨지고 액세스할 수 없습니다.
- 데이터 손실 없음: 모드를 전환해도 데이터가 삭제되지 않습니다. API가 조회하는 '백엔드'만 변경됩니다.
배포 모드 관리
배포 모드는 프로젝트 수준 설정입니다. GetRagEngineConfig 및 UpdateRagEngineConfig API를 사용하여 현재 모드를 보거나 변경할 수 있습니다. 배포 모드 간에 전환하고 Spanner 모드에 적합한 등급을 선택하는 방법에 대한 자세한 내용은 모드 간 전환 페이지를 참고하세요.
데이터 삭제 및 결제 중지
데이터는 모드 간에 격리되므로 리소스를 정리하고 결제를 중지하는 프로세스는 데이터가 있는 위치에 따라 약간 다릅니다.
- 서버리스 데이터 삭제: 활성 모드가 서버리스로 설정되어 있는지 확인합니다.
ListRagCorporaAPI를 호출하여 리소스를 확인한 후DeleteRagCorpusAPI를 사용하여 각 코퍼스를 수동으로 삭제합니다. - Spanner 데이터 삭제 (프로비저닝 해제): 활성 모드가 Spanner로 설정되어 있는지 확인합니다.
RagEngineConfig를 업데이트하고 Spanner 등급을Unprovisioned로 설정합니다. 이렇게 하면 전용 Spanner 인스턴스와 그 안에 있는 모든 RAG 데이터가 즉시 삭제되어 Spanner 모드의 관련 결제가 중지됩니다. 참고: 프로비저닝 해제된 등급을 사용하여 삭제된 데이터는 복구할 수 없습니다.
Spanner 모드와 서버리스 모드
| 기능 | 서버리스 모드 | Spanner 모드 |
|---|---|---|
| 비용 |
|
|
| 확장 | 완전 관리형 자동 확장 | 등급 선택을 구성해야 하지만 자동 확장 등급을 제공합니다. |
| 격리 | 스토리지가 격리되지 않음 | 스토리지 및 성능 격리를 제공합니다. |
| CMEK | 현재 CMEK 없음 | CMEK 지원 제공 |
| VPC 보안 제어 | 지원됨 | 지원됨 |
| 지원되는 벡터 DB |
|
|
다음 단계
- RAG Engine 사용을 시작하려면 RAG 빠른 시작을 참고하세요.
- 배포 모드를 변경하거나 Spanner 모드의 등급을 업데이트하려면 모드 간 전환을 참고하세요.
- Spanner 인스턴스를 삭제하려면 프로비저닝 해제된 등급으로 업데이트를 참고하세요.
- Spanner 모드에 대한 자세한 내용은 Spanner 모드 관리를 참고하세요.
- 서버리스 모드에 대한 자세한 내용은 서버리스 모드를 참고하세요.
- 가격 책정에 대한 자세한 내용은 Gemini Enterprise Agent Platform의 RAG Engine 결제를 참고하세요.