이 페이지에서는 모델, 재순위 지정, 벡터 스토리지 등 사용하는 Gemini Enterprise Agent Platform의 RAG Engine 구성요소를 기반으로 Gemini Enterprise Agent Platform의 RAG Engine 가격 책정 및 결제를 설명합니다.
자세한 내용은 Gemini Enterprise Agent Platform의 RAG Engine 개요 페이지를 참조하세요.
가격 책정 및 결제
이 표에서는 RAG 구성요소를 사용할 때 결제가 어떻게 이루어지는지 설명합니다.
| 구성요소 | RAG Engine에서 결제 방식 |
|---|---|
| 데이터 수집 | RAG Engine은 다양한 데이터 소스에서 데이터 수집을 지원합니다. 예를 들어 로컬 파일, Cloud Storage, Google Drive를 업로드합니다. RAG Engine에서 이러한 데이터 소스의 파일에 액세스하는 것은 무료이지만 해당 데이터 소스에서 데이터 전송 요금이 부과될 수 있습니다. 예를 들어 데이터 이그레스 비용입니다. |
| 데이터 변환 (파일 파싱) |
|
| 데이터 변환 (파일 청크) | 고정 크기 청크를 지원하며 무료입니다. |
| 임베딩 생성 |
RAG Engine은 지정한 임베딩 모델을 사용하여 임베딩 생성을 조정하며, 프로젝트에 해당 모델과 관련된 비용이 청구됩니다. 자세한 가격 정보는 Gemini Enterprise Agent Platform에서 AI 모델을 빌드하고 배포하는 데 드는 비용을 참조하세요. |
| 데이터 색인 및 검색 |
RAG Engine은 벡터 검색을 위한 두 가지 카테고리의 벡터 데이터베이스를 지원합니다.
RAG 관리형 데이터베이스는 다음 두 가지 용도로 사용됩니다.
RAG 관리형 데이터베이스는 Spanner 인스턴스를 백엔드로 사용합니다. 각 프로젝트에서 RAG Engine은 고객별 프로젝트를 프로비저닝하고 RAG Engine에 저장된 RAG 관리형 리소스를 관리하므로 데이터가 물리적으로 격리됩니다. Google Cloud
프로젝트의 RAG 코퍼스에서 벡터 검색에 RAG 관리 데이터베이스를 사용하도록 선택하면 RAG 관리 Spanner 인스턴스에 요금이 청구됩니다. RAG Engine은 Spanner 비용을 확인하고 지불할 수 있도록 해당 RAG 관리형 프로젝트의 Spanner 비용을 프로젝트에 표시합니다. Google Cloud Spanner 가격 책정 세부정보는 Spanner 가격 책정을 참조하세요. |
| Gemini Enterprise Agent Platform의 RAG Engine 재순위 지정 |
검색 후에는 다음 순위 지정 도구가 지원됩니다.
|
RAG 엔진 삭제
다음 코드 샘플은 콘솔, Python, REST의 RAG Engine을 삭제하는 방법을 보여줍니다: Google Cloud
다음 단계
Vertex AI SDK를 사용하여 Gemini Enterprise Agent Platform의 RAG Engine 태스크를 실행하는 방법은 Python용 RAG 빠른 시작을 참조하세요.
그라운딩에 대한 자세한 내용은 그라운딩 개요를 참조하세요.
RAG의 응답에 대해 자세히 알아보려면 검색 및 생성 출력 RAG Engine을 참조하세요.
RAG 아키텍처에 대해 알아보려면 다음을 참조하세요.