가격이 높다고 해서 더 스마트한 모델이 보장되는 것은 아닙니다. 공개 LMArena 점수가 포함된 31 모델 중에서 실시간 가격과 비교하여 실제 벤치마크 Elo의 순위를 매겼습니다.
minimax-m3는 LMArena의 인간 선호 순위표에서 1448의 점수를 매기면서 3:1 혼합에서 100만 토큰당 약 $0.97의 비용을 지불합니다. 이는 가격의 작은 부분으로 최고의 모델과 몇 포인트 이내입니다. 벤치마크 Elo는 당사의 추정치가 아닌 실제 제3자 데이터입니다.
우리가 추적하는 가장 높은 점수를 받은 모델인 claude-opus-4.6는 1M당 약 $20.00로 1504의 Elo를 게시합니다. 가치 리더는 훨씬 낮은 가격으로 품질에 매우 근접합니다. 따라서 대부분의 워크로드에서는 작고 종종 눈에 띄지 않는 품질 차이에 대해 큰 프리미엄을 지불하게 됩니다.
달러당 지능은 강력하고 저렴한 모델을 선호합니다. 마지막 단어가 아닌 시작 필터로 처리하십시오. 대기 시간, 컨텍스트 창, 도구 사용 및 자체 평가는 여전히 중요합니다. 현재 31 모델에만 공개 LMArena 점수가 있으므로 이는 전체 카탈로그가 아닌 측정된 필드의 순위를 지정합니다. 아래 지도는 효율성 대비 가격을 표시합니다.
모든 추적 모델은 입력 가격(로그 척도) 및 복합 효율성을 기준으로 표시됩니다. 왼쪽 상단으로 갈수록 달러당 가치가 더 좋아진다는 의미입니다.
각 점은 하나의 모델 · 색상 = 영역 · 점을 클릭하여 엽니다.
가격은 실제이며(OpenRouter를 통해, 매일 업데이트됨) Elo는 실제입니다(LMArena를 통해). 이는 투자나 조달에 대한 조언이 아닌 시장 분석입니다.