价格更高,并不代表模型更聪明。在 31 个有公开 LMArena 分数的模型里,我们用真实基准 Elo 对比实时价格。
minimax-m3 在 LMArena 人类偏好榜上得 1448 分,而按 3:1 折算每百万 Token 仅约 $0.97——离最强模型只差几分,价格却是其零头。基准 Elo 是真实的第三方数据,不是我们的估算。
我们追踪到分数最高的模型 claude-opus-4.6,Elo 为 1504,每百万约 $20.00。而性价比榜首在质量上已非常接近,价格却低得多——也就是说,大多数场景下,你是在为一点点(常常感知不到的)质量差距付出高昂溢价。
“每美元智能”偏向又强又便宜的模型;把它当作初筛,而非定论——延迟、上下文、工具调用以及你自己的评测同样重要。目前只有 31 个模型有公开的 LMArena 分数,所以这里排的是“已测”的范围,不是全部目录。下图按价格与效率分布。
每个收录模型按输入价格(对数刻度)与综合效率分布。越靠左上,单位成本性价比越高。
每个圆点代表一个模型 · 颜色代表地区 · 点击圆点可查看。
价格为真实数据(来自 OpenRouter,每日更新),Elo 为真实数据(来自 LMArena);本文为市场分析,不构成投资或采购建议。