Минимальная цена на генерацию полезного текста рухнула. Для моделей 489 Live Generation мы отобразили, насколько низко (и насколько многолюдно) стало дно рынка.
Самая дешевая модель поколения, которую мы отслеживаем, Llama-3.2-3B-Instruct, использует около $0.020 на 1 млн токенов в соотношении 3:1. Это не опечатка — небольшие, эффективные модели приблизили минимальный уровень к нулю, а качество нижнего уровня продолжает расти.
234 моделей поколения 489 теперь стоит менее 1 доллара за 1 миллион токенов, а 161 — менее 0,50 доллара. Между тем самая дорогая десятая часть каталога — в среднем $49.94. Для больших объемов работ, чувствительных к цене, дешевый уровень больше не является компромиссом — он используется по умолчанию.
Минимальные цены обычно означают меньшие модели, более короткий контекст или меньшее количество модальностей — это подходит для маршрутизации, классификации, извлечения и массового черчения, но в меньшей степени для самых сложных рассуждений. Сопоставьте модель с работой: дешево там, где это возможно, премиум только там, где это ощутимо окупается. На карте ниже показано соотношение цены и эффективности.
Каждая отслеживаемая модель построена по входной цене (логарифмическая шкала) и совокупной эффективности. Вверху слева означает лучшую ценность за доллар.
Каждая точка — это одна модель · цвет = регион · щелкните точку, чтобы открыть ее.
Цены реальны (через OpenRouter, обновляется ежедневно). Это анализ рынка, а не рекомендации по инвестициям или закупкам.