Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 임베딩 2

Gemini Embedding 2는 복잡한 검색 및 분석 작업에 적합한 Google의 임베딩 생성 모델입니다.

Gemini Embedding 2는 멀티모달 입력을 수락하여 3072차원 벡터를 생성합니다. 이미지, 텍스트, 문서, 오디오, 동영상 입력을 허용하고 생성된 벡터를 통합된 시맨틱 공간에 시맨틱으로 매핑합니다. 이를 통해 텍스트 설명을 기반으로 이미지를 검색하는 등의 작업을 실행할 수 있습니다.

Gemini Embedding 2에는 임베딩 품질과 유연성을 최적화하는 여러 기능이 도입되었습니다.

맞춤 작업 지침: 작업 지침 (예: task:code retrieval 또는 task:search result)을 지정하여 의도한 관계에 맞게 삽입을 최적화하고 특정 목표에 대한 더 정확한 결과를 검색합니다.
조정 가능한 결과 크기: 모델은 기본적으로 3072차원 부동 소수점 벡터를 생성합니다. 하지만 output_dimensionality 매개변수를 지정하면 더 작은 차원의 출력을 가져올 수 있습니다.
문서 OCR: 문서 입력에서 OCR을 읽습니다.
오디오 트랙 추출: 동영상 입력에서 오디오 트랙을 추출하고 동영상 프레임과 인터리브합니다.

Gemini Embedding 2를 사용하는 방법에 관한 자세한 내용은 멀티모달 임베딩 가져오기를 참고하세요.

Agent Studio에서 사용해 보기 예시 앱 배포 가격 보기

참고: '예시 앱 배포'를 사용하려면 결제 및 Agent Platform API가 사용 설정된 Google Cloud 프로젝트가 필요합니다.

모델 ID	`gemini-embedding-2`
형식	텍스트 입력 전용 이미지 입력 전용 오디오 입력 전용 동영상 입력 전용 삽입 출력 전용
토큰 한도	최대 입력 토큰	8,192
토큰 한도	최대 출력 토큰	해당 사항 없음
출력 크기	최대 3,072개 (MRL 지원)
최대 시퀀스 길이	토큰 8,192개
소비 옵션	프로비저닝된 처리량 지원되지 않음 일괄 추론 지원되지 않음 Pay-as-you-go 표준 PayGo 지원됨 고정 할당량 지원되지 않음
기술 사양	텍스트	최대 입력 토큰 수: 8,192 프롬프트당 최대 파일 수: 1개 파일당 최대 페이지 수 (PDF의 경우): 6 파일당 최대 파일 크기: 해당 사항 없음 스캔된 PDF의 OCR: 기본적으로 사용되지 않음 지원되는 MIME 유형: `text/plain`, `application/pdf`
	이미지	프롬프트당 최대 이미지 수: 6개 인라인 데이터 또는 콘솔을 통한 직접 업로드의 파일당 최대 파일 크기: 제한 없음 Google Cloud Storage의 파일당 최대 파일 크기: 제한 없음 프롬프트당 최대 출력 이미지 수: 해당 사항 없음 지원되는 MIME 유형: `image/png`, `image/jpeg`, `image/webp`, `image/bmp`, `image/heic`, `image/heif`, `image/avif`
	동영상	최대 동영상 길이 (오디오 포함): 80초 최대 동영상 길이 (오디오 제외): 120초 프롬프트당 최대 동영상 수: 1 지원되는 MIME 유형: `video/mpeg`, `video/mp4`
	오디오	프롬프트당 최대 오디오 길이: 180초 프롬프트당 최대 오디오 파일 수: 1 지원되는 MIME 유형: `audio/mp3`, `audio/wav`
지원되는 리전	모델 가용성	전역: `global` 미국 멀티 리전: `us` 유럽 멀티 리전: `eu`
지식 단절 날짜	2025년 11월
버전	`gemini-embedding-2` 출시 단계: 정식 버전 출시일: 2026년 4월 22일 `gemini-embedding-2-preview` 출시 단계: 공개 프리뷰 출시일: 2026년 3월 10일

Gemini 임베딩 2 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

Gemini 임베딩 2