Un precio más alto no garantiza un modelo más inteligente. Entre los modelos 31 con puntuaciones públicas LMArena, clasificamos el Elo de referencia real frente al precio en vivo.
minimax-m3 califica a 1448 en la tabla de clasificación de preferencia humana de LMArena, mientras que cuesta solo alrededor de $0.97 por 1 millón de tokens en una combinación de 3:1, a unos pocos puntos de los mejores modelos a una pequeña fracción de su precio. Benchmark Elo son datos reales de terceros, no nuestras estimaciones.
El modelo con la puntuación más alta que rastreamos, claude-opus-4.6, publica un Elo de 1504 de aproximadamente $20.00 por 1M. Los líderes en valor se acercan notablemente en cuanto a calidad y precios mucho más bajos, por lo que para la mayoría de las cargas de trabajo usted está pagando una gran prima por una diferencia de calidad pequeña, a menudo imperceptible.
La inteligencia por dólar favorece los modelos que son a la vez fuertes y baratos; Trátelo como un filtro inicial, no como la última palabra: la latencia, la ventana de contexto, el uso de herramientas y sus propias evaluaciones siguen siendo importantes. Actualmente, solo los modelos 31 tienen una puntuación LMArena pública, por lo que clasifica el campo medido, no todo el catálogo. El siguiente mapa muestra el precio frente a la eficiencia.
Cada modelo rastreado está trazado por el precio de los insumos (escala logarítmica) y la eficiencia compuesta. Hacia la parte superior izquierda significa un mejor valor por dólar.
Cada punto es un modelo · color = región · haga clic en un punto para abrirlo.
El precio es real (a través de OpenRouter, actualizado diariamente) y Elo es real (a través de LMArena). Se trata de un análisis de mercado, no de asesoramiento sobre inversiones o adquisiciones.