이 페이지에서는 RAG Engine이 무엇이고 어떻게 작동하는지 설명합니다.
| 설명 | 콘솔 |
|---|---|
| Vertex AI SDK를 사용하여 Gemini Enterprise Agent Platform 태스크에서 RAG Engine을 실행하는 방법은 Python용 RAG 빠른 시작을 참조하세요. | RAG Engine 사용해 보기 |
개요
Gemini Enterprise Agent Platform의 구성요소인 RAG Engine은 검색 증강 생성 (RAG)을 용이하게 합니다. RAG Engine은 컨텍스트 증강 대규모 언어 모델 (LLM) 애플리케이션을 개발하기 위한 데이터 프레임워크이기도 합니다. 컨텍스트 증강은 데이터에 LLM을 적용할 때 발생합니다. 이는 검색 증강 생성(RAG)을 구현합니다.
LLM의 일반적인 문제는 비공개 지식, 즉 조직의 데이터를 이해하지 못한다는 것입니다. RAG Engine을 사용하면 추가 비공개 정보로 LLM 컨텍스트를 보강할 수 있으므로 모델이 할루시네이션을 줄이고 질문에 더 정확하게 답변할 수 있습니다.
추가 지식 소스를 LLM이 보유한 기존 지식과 결합하여 더 나은 컨텍스트가 제공됩니다. 쿼리와 함께 개선된 컨텍스트는 LLM의 응답 품질을 향상시킵니다.
다음 이미지는 RAG Engine을 이해하는 데 필요한 주요 개념을 보여줍니다.

이러한 개념은 검색 증강 생성(RAG) 프로세스 순서로 나열되어 있습니다.
데이터 수집: 다양한 데이터 소스에서 데이터를 수집합니다. 예를 들면 로컬 파일, Cloud Storage, Google Drive가 있습니다.
데이터 변환: 색인 생성을 준비하는 동안 데이터를 변환합니다. 예를 들어 데이터가 청크로 분할됩니다.
임베딩: 단어 또는 텍스트 조각의 숫자 표현입니다. 이러한 숫자는 텍스트의 의미론적 의미와 컨텍스트를 캡처합니다. 유사하거나 관련된 단어 또는 텍스트는 유사한 임베딩을 갖는 경향이 있습니다. 즉, 고차원 벡터 공간에서 더 가깝습니다.
데이터 색인 생성: RAG Engine은 코퍼스라는 색인을 만듭니다. 색인은 검색에 최적화되도록 기술 자료를 구성합니다. 예를 들어, 색인은 방대한 참조 서적의 상세한 목차와 같습니다.
검색: 사용자가 질문하거나 프롬프트를 제공하면 RAG Engine의 검색 구성요소는 기술 자료를 통해 쿼리와 관련된 정보를 찾습니다.
생성: 검색된 정보는 생성 AI 모델이 사실에 근거하고 관련성 있는 응답을 생성하기 위한 가이드로 원래 사용자 쿼리에 추가된 컨텍스트가 됩니다.
지원되는 리전
RAG Engine은 다음 리전에서 지원됩니다.
| 리전 | 위치 | 설명 | 출시 단계 |
|---|---|---|---|
us-central1 |
아이오와 | v1 및 v1beta1 버전이 지원됩니다. |
허용 목록, GA |
us-east4 |
버지니아 | v1 및 v1beta1 버전이 지원됩니다. |
허용 목록, GA |
us-east1 |
몽크스 코너, 사우스캐롤라이나주 | v1 및 v1beta1 버전이 지원됩니다. |
허용 목록, 미리보기 |
europe-west3 |
독일 프랑크푸르트 | v1 및 v1beta1 버전이 지원됩니다. |
GA |
europe-west4 |
네덜란드 엠스하벤 | v1 및 v1beta1 버전이 지원됩니다. |
GA |
asia-east1 |
대만 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
asia-northeast1 |
도쿄 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
asia-northeast3 |
서울 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
asia-south1 |
뭄바이 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
asia-southeast1 |
싱가포르 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
europe-central2 |
바르샤바 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
europe-north1 |
핀란드 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
europe-southwest1 |
마드리드 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
europe-west1 |
벨기에 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
europe-west2 |
런던 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
europe-west6 |
취리히 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
europe-west8 |
밀라노 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
europe-west9 |
파리 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
us-east5 |
콜롬버스, 오하이오주 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
us-south1 |
댈러스, 텍사스주 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
us-west1 |
오리건 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
us-west4 |
라스베이거스, 네바다주 | v1 및 v1beta1 버전이 지원됩니다. |
미리보기 |
us-central1,us-east1,us-east4가Allowlist로 변경됩니다. RAG Engine을 실험하려면 다른 리전을 사용해 보세요.
RAG 엔진 삭제
RAG Engine 삭제에 대한 자세한 내용은 다음을 참조하세요.
다음 단계
Vertex AI SDK를 사용하여 Gemini Enterprise Agent Platform 태스크에서 RAG Engine을 실행하는 방법은 Python 용 RAG 빠른 시작을 참조하세요.
그라운딩에 대한 자세한 내용은 그라운딩 개요를 참조하세요.
RAG의 응답에 대한 자세한 내용은
GenerateContentResponse를 참조하세요.