O preço mínimo para geração de texto utilizável entrou em colapso. Nos modelos de geração ao vivo 489, mapeamos quão baixo – e quão lotado – o fundo do mercado se tornou.
O modelo de geração mais barato que rastreamos, Llama-3.2-3B-Instruct, roda cerca de $0.020 por 1 milhão de tokens em uma mistura de 3:1. Isso não é um erro de digitação – modelos pequenos e eficientes chegaram perto de zero e a qualidade no segmento inferior continua aumentando.
234 dos modelos da geração 489 agora custam menos de US$ 1 por 1 milhão de tokens, e 161 custa menos de US$ 0,50. Enquanto isso, o décimo mais caro do catálogo é em média $49.94. Para trabalhos de alto volume e sensíveis ao preço, o nível barato não é mais um compromisso – é o padrão.
Preços baixíssimos geralmente significam modelos menores, contexto mais curto ou menos modalidades – bom para roteamento, classificação, extração e elaboração em massa, nem tanto para o raciocínio mais difícil. Combine o modelo com o trabalho: barato onde puder, premium apenas onde for mensurável. O mapa abaixo representa o preço em relação à eficiência.
Cada modelo rastreado plotado por preço de entrada (escala logarítmica) e eficiência composta. No canto superior esquerdo significa melhor valor por dólar.
Cada ponto é um modelo · cor = região · clique em um ponto para abri-lo.
O preço é real (via OpenRouter, atualizado diariamente). Esta é uma análise de mercado, não um conselho de investimento ou aquisição.