Google 모델

Gemini Enterprise 에이전트 플랫폼의 Google 모델은 완전 관리형 서버리스 모델을 API로 제공합니다. 에이전트 플랫폼에서 Google 모델을 사용하려면 에이전트 플랫폼 API 엔드포인트로 직접 요청을 보내면 됩니다. Google 모델은 관리형 API를 사용하므로 인프라를 프로비저닝하거나 관리할 필요가 없습니다.

대답을 스트리밍하여 최종 사용자의 지연 시간 인식을 줄일 수 있습니다. 스트리밍된 응답은 서버 전송 이벤트 (SSE)를 사용하여 응답을 점진적으로 스트리밍합니다.

Gemma 4 26B A4B IT

Gemma 4 26B A4B IT는 텍스트 및 이미지 입력을 처리하고 텍스트 출력을 생성하는 Google의 멀티모달 모델입니다.

Gemma 4 26B A4B IT 모델 카드로 이동

Google 모델 사용

관리형 모델의 경우 curl 명령어를 사용하여 Gemini Enterprise 에이전트 플랫폼 엔드포인트에 다음 모델 이름으로 요청을 보낼 수 있습니다.

  • Gemma 4 26B A4B IT의 경우 gemma-4-26b-a4b-it-maas를 사용합니다.

Google 모델에 스트리밍 및 비스트리밍 호출을 수행하는 방법을 알아보려면 개방형 모델 API 호출을 참조하세요.

자체 배포된 Gemini Enterprise 에이전트 플랫폼 모델을 사용하려면 다음 단계를 따르세요.

  1. Model Garden 콘솔로 이동합니다.
  2. 관련 Gemini Enterprise 에이전트 플랫폼 모델을 찾습니다.
  3. 사용 설정 을 클릭하고 제공된 양식을 작성하여 필요한 상업적 사용 라이선스를 받습니다.

파트너 모델 배포 및 사용에 관한 자세한 내용은 파트너 모델 배포 및 예측 요청 을 참고하세요.

Google 모델 리전 가용성

Google 모델은 다음 리전에서 사용할 수 있습니다.

모델 리전
Gemma 4 26B A4B IT
  • global
    • 최대 출력: 128,000
    • 컨텍스트 길이: 262,144

다음 단계

개방형 모델 API를 호출하는 방법 알아보기