Um preço mais alto não garante um modelo mais inteligente. Entre os modelos 31 com pontuações públicas do LMArena, classificamos o benchmark real Elo em relação ao preço real.
minimax-m3 pontua 1448 na tabela de classificação de preferência humana do LMArena, ao mesmo tempo que custa apenas cerca de $0.97 por 1 milhão de tokens em uma mistura 3:1 – a poucos pontos dos melhores modelos por uma pequena fração de seu preço. O benchmark Elo são dados reais de terceiros, não nossa estimativa.
O modelo com maior pontuação que rastreamos, claude-opus-4.6, registra um Elo de 1504 em cerca de $20.00 por 1 milhão. Os líderes de valor chegam muito perto da qualidade, enquanto os preços são muito mais baixos. Portanto, para a maioria das cargas de trabalho, você está pagando um grande prêmio por uma pequena diferença de qualidade, muitas vezes imperceptível.
A inteligência por dólar favorece modelos que sejam fortes e baratos; trate-o como um filtro inicial, não como a última palavra – latência, janela de contexto, uso de ferramentas e suas próprias avaliações ainda são importantes. Atualmente, apenas os modelos 31 possuem uma pontuação LMArena pública, portanto, isso classifica o campo medido, não o catálogo inteiro. O mapa abaixo representa o preço em relação à eficiência.
Cada modelo rastreado plotado por preço de entrada (escala logarítmica) e eficiência composta. No canto superior esquerdo significa melhor valor por dólar.
Cada ponto é um modelo · cor = região · clique em um ponto para abri-lo.
O preço é real (via OpenRouter, atualizado diariamente) e Elo é real (via LMArena). Esta é uma análise de mercado, não um conselho de investimento ou aquisição.