Un prezzo più alto non garantisce un modello più intelligente. Tra i modelli 31 con punteggi LMArena pubblici, abbiamo classificato il benchmark Elo reale rispetto al prezzo in tempo reale.
minimax-m3 ottiene un punteggio 1448 nella classifica delle preferenze umane di LMArena, costando solo circa $0.97 per 1 milione di token su una miscela 3:1, a pochi punti dai migliori modelli a una piccola frazione del loro prezzo. L'Elo benchmark è costituito da dati reali di terze parti, non da una nostra stima.
Il modello con il punteggio più alto che monitoriamo, claude-opus-4.6, registra un Elo di 1504 pari a circa $20.00 per 1 milione. I leader di valore si avvicinano notevolmente alla qualità mentre i prezzi sono molto più bassi, quindi per la maggior parte dei carichi di lavoro si paga un grande premio per una differenza di qualità piccola, spesso impercettibile.
L’intelligenza per dollaro favorisce modelli forti ed economici; trattalo come un filtro iniziale, non come l'ultima parola: la latenza, la finestra di contesto, l'uso degli strumenti e le tue valutazioni contano ancora. Solo i modelli 31 attualmente portano un punteggio LMArena pubblico, quindi questo classifica il campo misurato, non l'intero catalogo. La mappa seguente traccia il rapporto tra prezzo e efficienza.
Ogni modello tracciato è tracciato in base al prezzo degli input (scala logaritmica) e all'efficienza composita. Verso l'alto a sinistra significa un migliore valore per dollaro.
Ogni punto è un modello · colore = regione · fare clic su un punto per aprirlo.
Il prezzo è reale (tramite OpenRouter, aggiornato quotidianamente) ed Elo è reale (tramite LMArena). Questa è un'analisi di mercato, non una consulenza sugli investimenti o sugli appalti.