Vertex AI에서 Parallel을 사용한 그라운딩은 Gemini 모델을 Parallel Web Systems의 검색 API에서 제공하는 공개 웹 데이터에 연결하는 별도의 제품 (Agreement에 정의됨)입니다. Google Cloud 이 서비스를 사용하면 Gemini가 수십억 개의 웹페이지에서 실시간 정보에 액세스하여 최신 사실 기반 응답을 제공할 수 있습니다.
다음 사항에 유의하세요: Parallel 을 사용하려면 Google Cloud에서 처리를 위해 특정 고객 데이터를 Parallel 별도 제품에 전송해야 합니다. Parallel 서비스 사용에는 Parallel의 별도 사용 약관 및 Parallel의 허용 사용 정책이 적용됩니다.
사용 사례
Parallel을 사용한 그라운딩은 다음과 같은 사용 사례에 적합합니다.
- 정보 완성 또는 보강 목적으로 웹 데이터 사용
- 더 복잡한 질문에 더 심층적인 웹 검색이 필요한 멀티홉 에이전트
- 웹 검색 데이터를 통합하는 API 빌드
- 최신 웹 정보를 사용하여 최종 사용자가 질문하고 복잡한 보고서를 만들 수 있는 직원 대상 어시스턴트
- 사용자가 정보에 기반한 구매 결정을 내릴 수 있는 소매 및 여행과 같은 소비자 대상 애플리케이션
- 뉴스 분석 및 KYC 확인과 같은 자동화된 작업을 실행하기 위해 자율적으로 실행되는 자동화된 에이전트
- 웹에서 최신 컨텍스트를 가져오는 수직 에이전트 (영업 에이전트, 코딩 에이전트, 금융 에이전트)
예시
2025년 라스베이거스 F1 그랑프리에서 우승한 사람은 누구인가요?
| 그라운딩 없음 | 그라운딩 포함 |
|---|---|
| 2025년 라스베이거스 그랑프리는 아직 개최되지 않았습니다. 경주는 2025년 11월 20~22일 주말에 개최될 예정입니다. 따라서 현재 우승자는 알 수 없습니다. | 2025년 라스베이거스 F1 그랑프리 우승자는 레드불 레이싱의 막스 페르스타펜입니다. 경주는 2025년 11월 22일에 개최되었습니다. 소스: domain1.com, domain2.com, ... |
지원되는 모델
Parallel Web Search를 사용한 그라운딩은 다음 모델에서 지원됩니다.
- Gemini 2.5 Flash (
gemini-2.5-flash) - Gemini 2.5 Flash-Lite (
gemini-2.5-flash-lite) - Gemini 2.5 Pro (
gemini-2.5-pro) - Gemini 3.1 Pro (
gemini-3.1-pro-preview) - Gemini 3 Flash Lite (
gemini-3-flash-lite-preview)
시작하기 전에
Parallel을 사용한 그라운딩을 사용하려면 Parallel 웹사이트에서 API 키를 가져와야 합니다. 이 API 키는 Gemini에 대한 요청에 사용됩니다.
Parallel을 사용하여 Gemini 응답 그라운딩
다음과 같이 REST API를 사용하여 Gemini에서 그라운딩된 응답을 요청합니다. 최적의 성능을 위해 기본값이 아닌 값을 엄격하게 요구하지 않는 한 선택적 매개변수에 기본 설정을 사용하는 것이 좋습니다.
REST
요청 데이터를 사용하기 전에 다음을 바꿉니다.
- LOCATION: 요청을 처리하는 리전입니다. 전역 엔드포인트를 사용하려면 엔드포인트 이름에서 위치를 제외하고 리소스 위치를 `global`로 구성합니다.
- PROJECT_ID: 프로젝트 ID입니다. Google Cloud
- MODEL_ID: 사용할 모델의 ID입니다.
- TEXT: 모델에 전송할 텍스트 프롬프트입니다.
- API_KEY: Parallel 웹 검색의 API 키입니다.
- EXCLUDE_DOMAINS: 선택사항: 그라운딩 소스에서 제외할 도메인 목록입니다. 지정된 경우 이러한 도메인의 소스가 제외됩니다. 허용되는 값은 도메인 (www.example.com) 또는 마침표로 시작하는 도메인 확장 프로그램( .gov, .edu, .co.uk)입니다. 최대 10개의 도메인을 지정할 수 있습니다.
- INCLUDE_DOMAINS: 선택사항: 그라운딩 소스에 포함할 도메인 목록입니다. 지정된 경우 이러한 도메인의 소스가 포함됩니다. 허용되는 값은 도메인 (www.example.com) 또는 마침표로 시작하는 도메인 확장 프로그램( .gov, .edu, .co.uk)입니다. 최대 10개의 도메인을 지정할 수 있습니다.
- MAX_CHARS_PER_RESULT: 선택사항: 각 검색 결과 발췌문에 포함할 최대 문자 수입니다. 지정되지 않은 경우 기본값은
30000입니다. 허용되는 범위는[1000, 100000]입니다. - MAX_CHARS_TOTAL: 선택사항: 모든 검색 결과 발췌문의 최대 총
문자 수입니다. 지정되지 않은 경우 기본값은
100000입니다. 허용되는 범위는[1000, 1000000]입니다. - MAX_RESULTS: 선택사항: 그라운딩에 사용할 최대 검색 결과 수입니다. 지정되지 않은 경우 기본값은
10입니다. 허용되는 범위 는[1, 20]입니다.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
JSON 요청 본문:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
요청을 보내려면 다음 옵션 중 하나를 펼칩니다.
다음과 비슷한 JSON 응답이 수신됩니다.
Quota
기본 할당량은 분당 200개의 프롬프트입니다. 속도 제한을 늘려야 하는 경우 사용 사례 및 요구사항과 함께 support@parallel.ai 및 Google 계정팀에 문의하세요.
결제
Parallel을 사용한 그라운딩을 사용하면 다음 요금이 부과됩니다.
- Gemini 토큰 소비량: 프롬프트 토큰, 사고 토큰, 출력 토큰. 자세한 내용은 가격 책정을 참조하세요.
- Gemini의 데이터로 그라운딩: 자세한 내용은 가격 책정을 참조하세요.
- Parallel에서 제공하는 입력 토큰에는 추가 요금이 부과되지 않습니다.
- Parallel의 검색 API 사용 가격 책정: 자세한 내용은 Parallel의 가격 책정 페이지를 참조하세요.