Gemini 3 Flash는 Gemini 3 Pro의 추론 기능과 Flash 라인의 지연 시간, 효율성, 비용 수준을 결합합니다. 이 모델은 추론을 개선하여 일상적인 작업을 지원할 뿐만 아니라 가장 복잡한 에이전트형 워크플로를 처리하도록 설계되었습니다.
Gemini 3 Flash는 성능, 제어, 멀티모달 충실도를 개선하기 위해 다음과 같은 여러 새로운 기능을 사용합니다.
사고 수준:
thinking_level파라미터를 사용해 모델이 실행하는 내부 추론량 (최소, 낮음, 중간 또는 높음)을 제어하여 응답 품질, 추론 복잡성, 지연 시간, 비용의 균형을 맞춥니다.thinking_level매개변수는 Gemini 3 모델의thinking_budget을 대체합니다.다양한 사고 수준에 관한 자세한 내용은 사고를 참고하세요.
사고 서명: 사고 서명의 유효성 검사를 더 엄격하게 하면 멀티턴 함수 호출의 신뢰성이 향상됩니다.
미디어 해상도:
media_resolution파라미터 (낮음, 중간, 높음, 매우 높음)를 사용하여 멀티모달 입력의 시각 처리 기능을 제어하며, 이는 토큰 사용량과 지연 시간에 영향을 미칩니다. 기본 해상도 설정은 Gemini 3 시작하기를 참고하세요.- 매우 높음 미디어 해상도 수준은
IMAGE모달리티에서만 사용할 수 있습니다. - PDF 토큰 수는
usage_metadata에서DOCUMENT모달리티가 아닌IMAGE모달리티로 표시됩니다.
- 매우 높음 미디어 해상도 수준은
멀티모달 함수 응답: 이제 함수 응답에 텍스트 외에도 이미지, PDF와 같은 멀티모달 객체를 포함할 수 있습니다.
스트리밍 함수 호출: 도구 사용 시 사용자 환경을 개선하기 위해 부분 함수 호출 인수를 스트리밍합니다.
이러한 기능 사용에 관한 자세한 내용은 Gemini 3 시작하기를 참고하세요.
Vertex AI에서 사용해 보기 Model Garden에서 보기 (미리보기) 예시 앱 배포
| 모델 ID | gemini-3-flash-preview |
|
|---|---|---|
| 지원되는 입력 및 출력 |
|
|
| 토큰 한도 |
|
|
| 기능 | ||
| 사용량 유형 |
|
|
| 기술 사양 | ||
| 이미지 |
|
|
| 문서 |
|
|
| 동영상 |
|
|
| 오디오 |
|
|
| 파라미터 기본값 |
|
|
| 지원되는 리전 | ||
|
모델 가용성 (Standard 종량제 및 프로비저닝된 처리량 포함) |
|
|
| 자세한 내용은 배포 및 엔드포인트를 참고하세요. | ||
| 지식 단절 날짜 | 2025년 1월 | |
| 버전 |
|
|
| 보안 제어 | ||
| 온라인 예측 |
|
|
| 일괄 예측 |
|
|
| 조정 |
|
|
| 컨텍스트 캐싱 |
|
|
| 자세한 내용은 보안 제어를 참조하세요. | ||
| 지원 언어 | 지원되는 언어를 참고하세요. | |
| 가격 책정 | 가격 책정을 참고하세요. | |