Fiyat ve zeka sınırı

Bir model seçerken önemli olan tek grafik: Her bir dolar için ne kadar ölçülen zeka elde edersiniz. Gerçek LMArena Elo'ya karşı karma token fiyatını çiziyoruz ve verimlilik sınırını izliyoruz - daha düşük fiyata kalite açısından başka hiçbir şeyin geçemeyeceği modeller.

Kalite / fiyat

İstihbarat ve fiyat

Verimli sınırBİZÇinAB

Her nokta, gerçek bir LMArena insan tercihi puanına sahip bir modeldir. Yukarı = daha akıllı; sol = daha ucuz. Kesikli çizgi etkin sınırdır (her fiyat noktasında en iyi kalite).

Gerçek bir LMArena insan tercihi Elo'ya sahip 9 modelleri. Elo puanı olmayan modeller çizilmez.

Değer liderleri (sınırda)

Bu modeller verimlilik sınırında yer alıyor: Her biri için başka hiçbir paletli model, daha düşük bir karma fiyata daha yüksek LMArena kalitesi sunmuyor.

1qwen3.7-maxCN

elo 1475$2.96/1M

2gemini-3.1-pro-previewUS

elo 1486$7.00/1M

3claude-opus-4.6US

elo 1505$15.00/1M

Bu nasıl hesaplanır?

Kalite gerçek LMArena Elo'dur - kendi tahminimiz değil, kör kafa kafaya oylamalardan elde edilen insan tercihi sıralaması. Fiyat, her modelin takip edilen fiyatlandırmasından elde edilen girdi ve çıktı $/1 milyon tokenlerin karma ortalamasıdır.

Başka hiçbir modelin hem daha yüksek Elo'ya hem de daha düşük veya eşit fiyata sahip olmadığı bir model, verimlilik sınırındadır. Sınır, fiyatlar ve sıralamalar güncellendikçe yeniden hesaplanır.

Kasıtlı olarak bir 'Dolar başına Elo' oranı yayınlamıyoruz: Elo bir aralık ölçeği olduğundan bunu fiyata bölmek istatistiksel olarak anlamlı değildir. Sınır, kaliteyi maliyetle karşılaştırmanın dürüst yoludur.

Keşfetmek

Tüm modeller →Fiyat panosu →Fiyat değişiklikleri →