검색 및 RAG 환경을 빌드하기 위한 Vertex AI API

Vertex AI는 검색 증강 생성 (RAG) 애플리케이션 또는 검색엔진을 빌드하는 데 도움이 되는 API 모음을 제공합니다. 이 페이지에서는 이러한 API를 소개합니다.

검색 및 생성

대규모 언어 모델(LLM)은 RAG를 통해 사용자가 선택한 데이터 소스에 그라운딩된 응답을 생성할 수 있습니다. RAG에는 두 가지 단계가 있습니다.

  1. 검색: 가장 관련성 있는 사실을 빠르게 가져오는 것이 일반적인 검색 문제일 수 있습니다. RAG를 이용하면 답변을 생성하는 데 중요한 사실을 빠르게 검색할 수 있습니다.
  2. 생성: LLM은 검색된 사실을 이용해서 그라운딩된 응답을 생성합니다.

Vertex AI는 다양한 개발자 요구사항에 맞게 두 단계 모두에 대한 옵션을 제공합니다.

검색

필요에 따라 가장 적합한 검색 방법을 선택하세요.

  • Vertex AI Search: Vertex AI Search는 Google 검색 품질의 정보 검색 엔진으로, 기업 데이터를 사용하는 모든 생성형 AI 애플리케이션의 구성요소가 될 수 있습니다. Vertex AI Search는 다양한 문서 유형을 처리하고 BigQuery 및 다양한 서드 파티 시스템을 비롯한 다양한 소스 시스템에 연결할 수 있는 기능을 갖춘 RAG용 즉시 사용 가능한 시맨틱 및 키워드 검색 엔진으로 작동합니다.

    자세한 내용은 Vertex AI Search를 참조하세요.

  • 자체 검색 빌드: 시맨틱 검색을 빌드하려면 커스텀 RAG 시스템의 구성요소에 Vertex AI API를 사용할 수 있습니다. 이 API 모음은 문서 파싱, 임베딩 생성, 벡터 검색, 시맨틱 순위 지정에 고품질 구현을 제공합니다. 이러한 하위 수준 API를 사용하면 검색기 설계를 완전히 유연하게 할 수 있으며 동시에 하위 수준 Vertex AI API를 사용하여 TTM(time to market) 속도를 높이고 품질을 높일 수 있습니다.

    자세한 내용은 자체 검색 증강 생성 빌드를 참조하세요.

  • 기존 검색 가져오기: 기존 검색을 그라운딩된 생성의 검색기로 사용할 수 있습니다. RAG용 Vertex API를 사용하여 기존 검색을 더 높은 품질로 업그레이드할 수도 있습니다. 자세한 내용은 그라운딩 개요를 참고하세요.

  • Vertex AI RAG Engine: Vertex AI RAG Engine은 RAG 오케스트레이션을 위한 완전 관리형 런타임을 제공하므로 개발자가 프로덕션 및 엔터프라이즈급 컨텍스트에서 사용할 RAG를 빌드할 수 있습니다.

    자세한 내용은 Vertex AI의 생성형 AI 문서에서 Vertex AI RAG Engine 개요를 참고하세요.

  • Google 검색: Gemini 모델에 Google 검색을 사용한 그라운딩을 사용하면 Gemini가 Google 검색을 사용하고 관련 검색 결과에 그라운딩된 출력을 생성합니다. 이 검색 방법은 관리가 필요하지 않으며 Gemini에서 사용할 수 있는 전 세계의 지식을 얻을 수 있습니다.

    자세한 내용은 Vertex AI의 생성형 AI 문서에서 Google 검색을 사용한 그라운딩을 참조하세요.

생성

필요에 따라 가장 적합한 생성 방법을 선택하세요.

  • 데이터로 그라운딩: 사용자의 질문에 대한 적절하게 그라운딩된 답변을 생성합니다. 그라운딩된 생성 API는 특수화되고 미세 조정된 Gemini 모델을 사용하며, 할루시네이션을 줄이고 소스 또는 서드 파티 소스에 그라운딩된 응답을 제공하는 효과적인 방법입니다(그라운딩 지원 콘텐츠 참조 포함).

    자세한 내용은 RAG로 그라운딩된 답변 생성을 참고하세요.

    Vertex AI의 생성형 AI를 사용하여 Vertex AI Search 데이터에 대한 대답을 그라운딩할 수도 있습니다. 자세한 내용은 데이터로 그라운딩을 참고하세요.

  • Google 검색으로 그라운딩: Gemini는 Google의 가장 강력한 모델이며 Google 검색을 사용한 그라운딩을 기본으로 제공합니다. 이를 사용하여 완전히 맞춤설정된 그라운딩된 생성 솔루션을 빌드할 수 있습니다.

    자세한 내용은 Vertex AI의 생성형 AI 문서에서 Google 검색을 사용한 그라운딩을 참조하세요.

  • Model Garden: 원하는 모델을 완전히 제어하려면 Vertex AI Model Garden의 모델을 생성에 사용할 수 있습니다.

자체 검색 증강 생성 빌드

그라운딩용 커스텀 RAG 시스템을 개발하면 프로세스의 모든 단계에서 유연성과 제어 기능을 제공할 수 있습니다. Vertex AI는 자체 검색 솔루션을 만드는 데 도움이 되는 API 모음을 제공합니다. 이러한 API를 사용하면 RAG 애플리케이션의 설계를 완전히 유연하게 할 수 있으며 동시에 하위 수준의 Vertex AI API를 사용하여 TTM(time to market) 속도를 높이고 품질을 높일 수 있습니다.

  • Document AI 레이아웃 파서 Document AI 레이아웃 파서는 다양한 형식의 문서를 구조화된 표현으로 변환하여 단락, 표, 목록과 같은 콘텐츠와 제목, 페이지 헤더, 바닥글과 같은 구조적 요소에 액세스할 수 있도록 하고 다양한 생성형 AI 및 탐색 앱에서 정보 검색을 용이하게 하는 컨텍스트 인식 청크를 만듭니다.

    자세한 내용은 Document AI 문서의 Document AI 레이아웃 파서를 참조하세요.

  • Embeddings API: Vertex AI Embeddings API를 사용하면 텍스트 또는 멀티모달 입력의 임베딩을 만들 수 있습니다. 임베딩은 입력의 의미를 포착하도록 설계된 부동 소수점 숫자의 벡터입니다. 임베딩을 사용하여 벡터 검색을 통해 시맨틱 검색을 지원할 수 있습니다.

    자세한 내용은 Vertex AI의 생성형 AI 문서에서 텍스트 임베딩멀티모달 임베딩을 참조하세요.

  • 벡터 검색. 검색 엔진은 RAG 또는 검색 애플리케이션의 핵심 부분입니다. Vertex AI 벡터 검색은 수십억 개의 의미상 유사하거나 관련된 항목을 대규모로 검색할 수 있는 검색 엔진으로 높은 초당 쿼리 수(QPS), 높은 재현율, 낮은 지연 시간, 뛰어난 비용 효율성을 제공합니다. 밀집 임베딩을 검색할 수 있으며 공개 미리보기에서 희소 임베딩 키워드 검색과 하이브리드 검색을 지원합니다.

    자세한 내용은 Vertex AI 문서의 Vertex AI 벡터 검색 개요를 참조하세요.

  • Ranking API Ranking API는 문서 목록을 가져와 문서가 지정된 쿼리와 얼마나 관련성이 있는지에 따라 문서의 순위를 다시 지정합니다. 문서와 쿼리의 시맨틱 유사성만 고려하는 임베딩과 비교하여 Ranking API는 문서가 특정 쿼리에 얼마나 잘 대답하는지에 관한 정확한 점수를 제공할 수 있습니다.

    자세한 내용은 Ranking API로 검색 및 RAG 품질 개선을 참고하세요.

  • Grounded Generation API Grounded Generation API를 사용하여 사용자의 프롬프트에 대한 적절하게 그라운딩된 답변을 생성합니다. 그라운딩 소스는 Vertex AI Search 데이터 스토어, 제공한 커스텀 데이터 또는 Google 검색일 수 있습니다.

    자세한 내용은 그라운딩된 답변 생성을 참조하세요.

  • 콘텐츠 생성 API 콘텐츠 생성 API를 사용하여 사용자의 프롬프트에 대한 적절하게 그라운딩된 답변을 생성합니다. 그라운딩 소스는 Vertex AI Search 데이터 스토어 또는 Google 검색일 수 있습니다.

    자세한 내용은 Google 검색으로 그라운딩 또는 데이터로 그라운딩을 참고하세요.

  • Check Grounding API Check Grounding API는 지정된 참조 텍스트 집합에서 지정된 텍스트가 얼마나 그라운딩되었는지 확인합니다. API는 참조 텍스트에서 지원 인용을 생성하여 지정된 텍스트가 참조 텍스트에 의해 지원되는 위치를 나타낼 수 있습니다. 이 API는 무엇보다도 RAG 시스템의 응답이 그라운딩되었는지 평가하는 데 사용할 수 있습니다. 또한 실험적 기능으로 API는 주어진 텍스트와 참조 텍스트가 일치하지 않는 부분을 보여주는 모순된 인용을 생성합니다.

    자세한 내용은 그라운딩 확인을 참조하세요.

워크플로: 비정형 데이터에서 그라운딩된 대답 생성

다음은 Vertex AI RAG API를 통합하여 비정형 데이터에서 그라운딩된 응답을 생성하는 방법을 간략히 보여주는 워크플로입니다.

  1. PDF 파일, HTML 파일, 텍스트가 포함된 이미지와 같은 비정형 문서를 Cloud Storage 위치로 가져옵니다.
  2. 레이아웃 파서를 사용하여 가져온 문서를 처리합니다. 레이아웃 파서는 비정형 문서를 청크로 분해하고 비정형 콘텐츠를 정형 표현으로 변환합니다. 레이아웃 파서는 청크에서 주석도 추출합니다.
  3. Vertex AI 텍스트 임베딩 API를 사용하여 청크의 텍스트 임베딩을 생성합니다.
  4. 벡터 검색을 사용하여 청크 임베딩을 색인 생성 및 검색합니다.
  5. Ranking API를 사용하여 청크 순위를 매기고 순위가 가장 높은 청크를 결정합니다.
  6. Grounded Generation API를 사용하거나 Generate Content API를 사용하여 순위가 가장 높은 청크를 기반으로 그라운딩된 답변을 생성합니다.

Google 모델이 아닌 답변 생성 모델을 사용하여 답변을 생성한 경우 그라운딩 확인 메서드를 사용하여 이러한 답변의 그라운딩을 확인할 수 있습니다.