Более высокая цена не гарантирует более умную модель. Среди моделей 31 с публичными оценками LMArena мы сопоставили реальный эталон Elo с реальной ценой.
minimax-m3 оценивает 1448 в таблице лидеров по предпочтениям людей LMArena, при этом стоимость составляет всего около $0.97 за 1 миллион токенов при соотношении 3:1 — в пределах нескольких пунктов от самых лучших моделей за небольшую часть их цены. Бенчмарк Elo — это реальные данные третьих лиц, а не наша оценка.
Самая результативная модель, которую мы отслеживаем, claude-opus-4.6, имеет Elo 1504 на уровне примерно $20.00 на 1 миллион. Лидеры по стоимости значительно близки по качеству, но при этом цены гораздо ниже — поэтому для большинства рабочих нагрузок вы платите большую премию за небольшую, часто незаметную разницу в качестве.
Интеллект на доллар отдает предпочтение моделям, которые одновременно сильны и дешевы; относитесь к нему как к стартовому фильтру, а не как к последнему слову — задержка, контекстное окно, использование инструментов и ваши собственные оценки по-прежнему имеют значение. В настоящее время только модели 31 имеют публичный рейтинг LMArena, поэтому он оценивает измеряемую область, а не весь каталог. На карте ниже показано соотношение цены и эффективности.
Каждая отслеживаемая модель построена по входной цене (логарифмическая шкала) и совокупной эффективности. Вверху слева означает лучшую ценность за доллар.
Каждая точка — это одна модель · цвет = регион · щелкните точку, чтобы открыть ее.
Цены реальны (через OpenRouter, обновляются ежедневно), а Elo реальна (через LMArena). Это анализ рынка, а не рекомендации по инвестициям или закупкам.