Kimi 모델

Kimi 모델은 Gemini Enterprise Agent Platform에서 관리형 API 및 자체 배포 모델로 사용할 수 있습니다. 대답을 스트리밍하여 최종 사용자의 지연 시간 인식을 줄일 수 있습니다. 스트리밍된 응답은 서버 전송 이벤트 (SSE)를 사용하여 응답을 점진적으로 스트리밍합니다.

관리형 Kimi 모델

Kimi 모델은 완전 관리형 서버리스 모델을 API로 제공합니다. Agent Platform에서 Kimi 모델을 사용하려면 Agent Platform API 엔드포인트로 직접 요청을 보내면 됩니다. Kimi 모델을 관리형 API로 사용하는 경우 인프라를 프로비저닝하거나 관리할 필요가 없습니다.

Gemini Enterprise Agent Platform에서 사용할 수 있는 Kimi 모델은 다음과 같습니다. Kimi 모델에 액세스하려면 Model Garden 모델 카드로 이동합니다.

Kimi K2 사고 모드

Kimi K2 사고 모드는 복잡한 문제 해결과 심층적인 추론에 뛰어난 Kimi의 사고 모델입니다.

Kimi K2 사고 모델 카드로 이동

Kimi 모델 사용

관리형 모델의 경우 다음 모델 이름을 사용하여 curl 명령어로 Gemini Enterprise Agent Platform 엔드포인트에 요청을 보낼 수 있습니다.

  • Kimi K2 사고 모드의 경우 kimi-k2-thinking-maas를 사용합니다.

Kimi 모델에 스트리밍 및 비스트리밍 호출을 수행하는 방법을 알아보려면 개방형 모델 API 호출을 참조하세요.

자체 배포된 Gemini Enterprise Agent Platform 모델을 사용하려면 다음 단계를 따르세요.

  1. Model Garden 콘솔로 이동합니다.
  2. 관련 Gemini Enterprise Agent Platform 모델을 찾습니다.
  3. 사용 설정 을 클릭하고 제공된 양식을 작성하여 필요한 상업적 사용 라이선스를 받습니다.

파트너 모델 배포 및 사용에 관한 자세한 내용은 파트너 모델 배포 및 예측 요청 을 참고하세요.

Kimi 모델 리전 가용성

Kimi 모델은 다음 리전에서 사용할 수 있습니다.

모델 리전
Kimi K2 사고 모드
  • global
    • 최대 출력: 262,144
    • 컨텍스트 길이: 262,144

다음 단계

개방형 모델 API를 호출하는 방법 알아보기