Un prix plus élevé ne garantit pas un modèle plus intelligent. Parmi les modèles 31 avec des scores LMArena publics, nous avons classé la véritable référence Elo par rapport au prix en direct.
minimax-m3 obtient le score 1448 dans le classement des préférences humaines de LMArena tout en ne coûtant qu'environ $0.97 par million de jetons sur un mélange de 3 : 1 – à quelques points des meilleurs modèles à une petite fraction de leur prix. Benchmark Elo est constitué de données réelles de tiers, et non de notre estimation.
Le modèle le plus performant que nous suivons, claude-opus-4.6, affiche un Elo de 1504 à environ $20.00 pour 1 million. Les leaders en matière de valeur se rapprochent remarquablement de la qualité tout en proposant des prix bien inférieurs. Ainsi, pour la plupart des charges de travail, vous payez un supplément important pour une petite différence de qualité, souvent imperceptible.
L’intelligence par dollar favorise les modèles à la fois solides et bon marché ; traitez-le comme un filtre de départ, pas comme le dernier mot : la latence, la fenêtre contextuelle, l'utilisation des outils et vos propres évaluations comptent toujours. Seuls les modèles 31 portent actuellement un score LMArena public, ce qui permet de classer le champ mesuré, et non l'ensemble du catalogue. La carte ci-dessous représente le prix par rapport à l’efficacité.
Chaque modèle suivi est représenté par prix des intrants (échelle logarithmique) et efficacité composite. Vers le coin supérieur gauche signifie une meilleure valeur par dollar.
Chaque point est un modèle · couleur = région · cliquez sur un point pour l'ouvrir.
Le prix est réel (via OpenRouter, mis à jour quotidiennement) et Elo est réel (via LMArena). Il s’agit d’une analyse de marché et non de conseils en matière d’investissement ou d’approvisionnement.