Gemini Embedding 2는 복잡한 검색 및 분석 작업에 적합한 Google의 임베딩 생성 모델입니다.
Gemini Embedding 2는 멀티모달 입력을 수락하여 3072차원 벡터를 생성합니다. 이미지, 텍스트, 문서, 오디오, 동영상 입력을 수락하고 생성된 벡터를 의미상으로 통합된 시맨틱 공간에 매핑합니다. 이를 통해 텍스트 설명을 기반으로 이미지를 검색하는 등의 작업을 실행할 수 있습니다.
Gemini Embedding 2는 임베딩 품질과 유연성을 최적화하기 위한 여러 기능을 도입합니다.
맞춤 작업 안내: 작업 안내 (예:
task:code retrieval또는task:search result)를 지정하여 의도된 관계에 맞게 임베딩을 최적화하고 특정 목표에 대해 더 정확한 결과를 검색합니다.조정 가능한 결과 크기: 모델은 기본적으로 3072차원 부동 소수점 벡터를 생성합니다. 하지만
output_dimensionality매개변수를 지정하여 더 작은 차원의 출력을 검색할 수 있습니다.문서 OCR: 문서 입력에서 OCR을 읽습니다.
오디오 트랙 추출: 동영상 입력에서 오디오 트랙을 추출하고 동영상 프레임과 인터리브합니다.
Agent Platform에서 사용해 보기 (미리보기) 예시 앱 배포
| 모델 ID | gemini-embedding-2 |
|
|---|---|---|
| 지원되는 입력 및 출력 |
|
|
| 토큰 한도 |
|
|
| 최대 시퀀스 길이 |
8,192개의 토큰 |
|
| 출력 크기 |
최대 3,072개 (MRL 지원 포함) |
|
| 소비 옵션 |
|
|
| 자세한 내용은 소비 옵션을 참고하세요. | ||
| 기술 사양 | ||
| 이미지 |
|
|
| 문서 |
|
|
| 동영상 |
|
|
| 오디오 |
|
|
| 파라미터 기본값 |
|
|
| 지원되는 리전 | ||
|
모델 가용성 |
|
|
| 자세한 내용은 배포 및 엔드포인트를 참고하세요. | ||
| 지식 단절 날짜 | 2025년 11월 | |
| 버전 |
|
|
| 보안 제어 | ||
| 자세한 내용은 보안 제어를 참고하세요. | ||
| 지원 언어 | 지원되는 언어를 참고하세요. | |
| 가격 책정 | 가격 책정을 참고하세요. | |