Kimi K2 Thinking

Kimi K2 Thinking은 '사고 에이전트'로 작동하는 오픈소스 모델로, 다양한 벤치마크에서 최첨단 성능을 달성하기 위해 도구를 사용하는 동안 단계별로 추론합니다. 인간의 개입 없이 최대 200~300개의 순차적 도구 호출을 실행할 수 있어 다양한 작업에서 복잡한 문제를 해결할 수 있습니다. 이 모델은 양자화 인식 학습(QAT)을 사용하여 INT4 추론을 지원하며, 이를 통해 생성 속도가 약 2배 향상됩니다.

Model Garden에서 모델 카드 보기

모델 ID kimi-k2-thinking-maas
출시 단계 GA
지원되는 입력 및 출력
  • 입력:
    텍스트, 문서
  • 출력:
    텍스트
기능
사용량 유형
버전
  • Kimi K2 Thinking
    • 출시 단계: 정식 버전
    • 출시일: 2025년 11월 13일
지원되는 리전

모델 가용성

  • 미국
    • global

ML 처리

  • 미국
    • Multi-region
한도

전역:

  • 최대 출력: 262,144
  • 컨텍스트 길이: 262,144

가격 책정 가격 책정을 참고하세요.