Gemini Enterprise Agent Platform의 RAG 엔진 결제

이 페이지에서는 모델, 재순위 지정, 벡터 스토리지 등 사용하는 Gemini Enterprise Agent Platform의 RAG Engine 구성요소를 기반으로 Gemini Enterprise Agent Platform의 RAG Engine 가격 책정 및 결제를 설명합니다.

자세한 내용은 Gemini Enterprise Agent Platform의 RAG Engine 개요 페이지를 참조하세요.

가격 책정 및 결제

이 표에서는 RAG 구성요소를 사용할 때 결제가 어떻게 이루어지는지 설명합니다.

구성요소 RAG Engine에서 결제 방식
데이터 수집 RAG Engine은 다양한 데이터 소스에서 데이터 수집을 지원합니다. 예를 들어 로컬 파일, Cloud Storage, Google Drive를 업로드합니다. RAG Engine에서 이러한 데이터 소스의 파일에 액세스하는 것은 무료이지만 해당 데이터 소스에서 데이터 전송 요금이 부과될 수 있습니다. 예를 들어 데이터 이그레스 비용입니다.
데이터 변환 (파일 파싱)
  • 기본 파서: 무료입니다.
  • LLM 파서: RAG Engine은 지정한 LLM 모델을 사용하여 파일을 파싱하며, 프로젝트에서 직접 LLM 모델 비용을 확인하고 지불합니다.
  • Document AI 레이아웃 파서: RAG Engine은 지정한 Document AI 레이아웃 파서를 사용하여 파일을 처리하며, 프로젝트에서 직접 Document AI 레이아웃 파서 사용 비용을 확인하고 지불합니다.
데이터 변환 (파일 청크) 고정 크기 청크를 지원하며 무료입니다.
임베딩 생성

RAG Engine은 지정한 임베딩 모델을 사용하여 임베딩 생성을 조정하며, 프로젝트에 해당 모델과 관련된 비용이 청구됩니다.

자세한 가격 정보는 Gemini Enterprise Agent Platform에서 AI 모델을 빌드하고 배포하는 데 드는 비용을 참조하세요.

데이터 색인 및 검색

RAG Engine은 벡터 검색을 위한 두 가지 카테고리의 벡터 데이터베이스를 지원합니다.

  • RAG 관리형 데이터베이스
  • 자체 벡터 데이터베이스

RAG 관리형 데이터베이스는 다음 두 가지 용도로 사용됩니다.

  • RAG 관리형 데이터베이스는 RAG 코퍼스, RAG 파일과 같은 RAG 리소스를 저장합니다. 파일 콘텐츠는 제외됩니다.
  • 선택에 따라 벡터 검색을 위해 임베딩 색인을 생성하고 검색합니다.

RAG 관리형 데이터베이스는 Spanner 인스턴스를 백엔드로 사용합니다.

각 프로젝트에서 RAG Engine은 고객별 프로젝트를 프로비저닝하고 RAG Engine에 저장된 RAG 관리형 리소스를 관리하므로 데이터가 물리적으로 격리됩니다. Google Cloud

RagManagedDB 기본 등급 또는 확대 단계 등급을 선택하면 RAG Engine이 해당 프로젝트에 Spanner Enterprise 버전 인스턴스를 프로비저닝합니다.

  • 기본 등급: 백업을 포함한 처리 단위 100개
  • 확대 단계 등급: 노드 1개 (처리 단위 1,000개)에서 시작하여 백업을 포함한 노드 10개까지 자동 확장

프로젝트의 RAG 코퍼스에서 벡터 검색에 RAG 관리 데이터베이스를 사용하도록 선택하면 RAG 관리 Spanner 인스턴스에 요금이 청구됩니다.

RAG Engine은 Spanner 비용을 확인하고 지불할 수 있도록 해당 RAG 관리형 프로젝트의 Spanner 비용을 프로젝트에 표시합니다. Google Cloud

Spanner 가격 책정 세부정보는 Spanner 가격 책정을 참조하세요.

Gemini Enterprise Agent Platform의 RAG Engine 재순위 지정

검색 후에는 다음 순위 지정 도구가 지원됩니다.

  • LLM 순위 조정: RAG Engine은 지정한 LLM 모델을 사용하여 검색 결과 순위를 다시 지정하며, 프로젝트에서 직접 LLM 모델 비용을 확인하고 지불합니다.
  • Agent Search Ranking API: RAG Engine은 Agent Search Ranking API를 사용하여 검색 결과 순위를 다시 지정하며, 프로젝트에서 직접 Ranking API를 확인하고 비용을 지불합니다.

RAG 엔진 삭제

다음 코드 샘플은 콘솔, Python, REST의 RAG Engine을 삭제하는 방법을 보여줍니다: Google Cloud

다음 단계