Kimi K2 Thinking

Kimi K2 Thinking은 '사고 에이전트'로 작동하는 오픈소스 모델로, 다양한 벤치마크에서 최첨단 성능을 달성하기 위해 도구를 사용하는 동안 단계별로 추론합니다. 인간의 개입 없이 최대 200~300개의 순차적 도구 호출을 실행할 수 있어 다양한 작업에서 복잡한 문제를 해결할 수 있습니다. 이 모델은 양자화 인식 학습(QAT)을 사용하여 INT4 추론을 지원하며, 이를 통해 생성 속도가 약 2배 향상됩니다.

Model Garden에서 모델 카드 보기

지원되는 리전
모델 ID	`kimi-k2-thinking-maas`
출시 단계	GA
지원되는 입력 및 출력	입력: 텍스트, 문서 출력: 텍스트
기능	지원됨 함수 호출 구조화된 출력 사고 지원되지 않음 일괄 예측
사용량 유형	지원됨 동적 공유 할당량 프로비저닝된 처리량 지원되지 않음 고정 할당량
버전	`Kimi K2 Thinking` 출시 단계: 정식 버전 출시일: 2025년 11월 13일
	모델 가용성	지역 `global`
	ML 처리	지역 `Multi-region`
한도	전역: 최대 출력: 262,144 컨텍스트 길이: 262,144
가격 책정	가격 책정을 참조하세요.

Kimi K2 Thinking 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

Kimi K2 Thinking