이 라인의 추적 버전 전체에 $/1M을 혼합했습니다.
1M 토큰당 일반적인 3:1 출력-입력 혼합
2026-05-11 기준 가격 · 원천: zhipu_bigmodel_official_reference
광범위한 기능과 저렴한 비용이 가장 중요한 범용 텍스트 생성, 채팅, 요약 및 콘텐츠 워크로드입니다.
Compared with GLM-4.5, this generation brings several key improvements: Longer context window: The context window has been expanded from 128K to 200K tokens, enabling the model to handle more complex...
glm-4.6는 Zhipu AI (GLM)(CN)의 텍스트 모델입니다. HotON.ai는 203K 토큰 컨텍스트 창을 사용하여 1M 입력 토큰당 $0.39 및 1M 출력 토큰당 $1.90로 이를 추적합니다. 복합 효율성 점수는 성공적인 작업당 추정된 $0.002에서 89/100입니다.
glm-4.6는 1M 입력 토큰당 $0.39, 1M 출력 토큰당 $1.90로 추적됩니다. 일반적인 3:1 출력-입력 워크로드는 대략 1M 토큰당 $1.52로 혼합됩니다. 수치는 예시적인 데모 데이터입니다.
광범위한 기능과 저렴한 비용이 가장 중요한 범용 텍스트 생성, 채팅, 요약 및 콘텐츠 워크로드입니다.
glm-4.6는 최대 203K 토큰 컨텍스트 창을 지원합니다. 이는 단일 요청으로 긴 문서와 확장된 대화를 처리할 수 있을 만큼 충분히 큽니다.
HotON.ai 추적 세트 내에서 glm-4.6는 입력 가격에서 모델의 48%보다 저렴하고 전체 효율성 기준으로 521의 #171 순위를 매깁니다.
예 — minimax-m2.5는 1M 출력 토큰당 $0.99의 저렴한 옵션이면서도 유사한 텍스트 사용 사례를 계속 다루고 있습니다. HotON.ai에서 나란히 비교해 보세요.
가격은 실제입니다(매일 업데이트되는 TestKey 카탈로그를 통해). 품질(Arena Elo)은 모델이 LMArena에서 순위가 매겨진 곳에서 실제입니다. 속도, 가용성 및 효율성은 모델링된 추정치입니다.