Gemini Embedding 2

Gemini Embedding 2는 복잡한 검색 및 분석 작업에 적합한 Google의 임베딩 생성 모델입니다.

Gemini Embedding 2는 멀티모달 입력을 수락하여 3072차원 벡터를 생성합니다. 이미지, 텍스트, 문서, 오디오, 동영상 입력을 수락하고 생성된 벡터를 의미상으로 통합된 시맨틱 공간에 매핑합니다. 이를 통해 텍스트 설명을 기반으로 이미지를 검색하는 등의 작업을 실행할 수 있습니다.

Gemini Embedding 2는 임베딩 품질과 유연성을 최적화하기 위한 여러 기능을 도입합니다.

  • 맞춤 작업 안내: 작업 안내 (예: task:code retrieval 또는 task:search result)를 지정하여 의도된 관계에 맞게 임베딩을 최적화하고 특정 목표에 대해 더 정확한 결과를 검색합니다.

  • 조정 가능한 결과 크기: 모델은 기본적으로 3072차원 부동 소수점 벡터를 생성합니다. 하지만 output_dimensionality 매개변수를 지정하여 더 작은 차원의 출력을 검색할 수 있습니다.

  • 문서 OCR: 문서 입력에서 OCR을 읽습니다.

  • 오디오 트랙 추출: 동영상 입력에서 오디오 트랙을 추출하고 동영상 프레임과 인터리브합니다.

Agent Platform에서 사용해 보기 (미리보기) 예시 앱 배포

참고: '예시 앱 배포' 기능을 사용하려면 결제 및 Agent Platform API가 사용 설정된 Google Cloud 프로젝트가 필요합니다.
모델 ID gemini-embedding-2
지원되는 입력 및 출력
  • 입력:
    텍스트, 이미지, 오디오, 동영상, PDF
  • 출력:
    임베딩
토큰 한도
  • 최대 입력 토큰: 8,192
  • 최대 출력 토큰: N/A
최대 시퀀스 길이

8,192개의 토큰

출력 크기

최대 3,072개 (MRL 지원 포함)

소비 옵션
자세한 내용은 소비 옵션을 참고하세요.
기술 사양
이미지
  • 프롬프트당 최대 이미지 수: 6개
  • 인라인 데이터 또는 콘솔을 통한 직접 업로드의 파일당 최대 파일 크기: 제한 없음
  • Google Cloud Storage의 파일당 최대 파일 크기: 제한 없음
  • 프롬프트당 최대 출력 이미지 수: N/A
  • 지원되는 MIME 유형:
    image/png, image/jpeg
문서
  • 프롬프트당 최대 파일 수: 1개
  • 파일당 최대 페이지 수: 6
  • 파일당 최대 파일 크기: N/A
  • 지원되는 MIME 유형:
    application/pdf
동영상
  • 최대 동영상 길이 (오디오 포함): 80초
  • 최대 동영상 길이 (오디오 제외): 120초
  • 프롬프트당 최대 동영상 수: 1개
  • 지원되는 MIME 유형:
    video/mpeg, video/mp4
오디오
  • 프롬프트당 최대 오디오 길이: 180초
  • 프롬프트당 최대 오디오 파일 수: 1개
  • 지원되는 MIME 유형:
    audio/mp3, audio/wav
파라미터 기본값
지원되는 리전

모델 가용성

  • 전역
    • 전역
  • 미국 멀티 리전
    • 미국
  • 유럽 멀티 리전
    • eu
자세한 내용은 배포 및 엔드포인트를 참고하세요.
지식 단절 날짜 2025년 11월
버전
  • gemini-embedding-2
    • 출시 단계: 정식 버전
    • 출시일: 2026년 4월 22일
  • gemini-embedding-2-preview
    • 출시 단계: 공개 프리뷰
    • 출시일: 2026년 3월 10일
보안 제어
자세한 내용은 보안 제어를 참고하세요.
지원 언어 지원되는 언어를 참고하세요.
가격 책정 가격 책정을 참고하세요.