Batasan harga vs intelijen

Bagan tunggal yang penting saat memilih model: seberapa besar kecerdasan terukur yang Anda peroleh untuk setiap dolar. Kami memplot harga token campuran terhadap LMArena Elo asli dan menelusuri batas efisien — model yang kualitasnya tidak ada duanya dengan harga lebih rendah.

Kualitas / harga

Kecerdasan vs harga

Perbatasan yang efisienKITACinaUE

Setiap titik adalah model dengan skor preferensi manusia LMArena yang sebenarnya. Naik = lebih pintar; kiri = lebih murah. Garis putus-putus adalah batas efisien (kualitas terbaik pada setiap titik harga).

Model 9 dengan Elo preferensi manusia LMArena yang sebenarnya. Model tanpa skor Elo tidak akan diplot.

Pemimpin nilai (di garis depan)

Model-model ini berada di garis depan yang efisien: untuk masing-masing model, tidak ada model terlacak lainnya yang menawarkan kualitas LMArena lebih tinggi dengan harga campuran yang lebih rendah.

1qwen3.7-maxCN

Halo 1475$2.96/1M

2gemini-3.1-pro-previewUS

Halo 1486$7.00/1M

3claude-opus-4.6US

Halo 1505$15.00/1M

Bagaimana ini dihitung

Kualitas adalah LMArena Elo yang nyata - peringkat preferensi manusia dari pemungutan suara secara langsung, bukan perkiraan kami sendiri. Harga adalah rata-rata campuran token input dan output $/1 juta dari harga yang dilacak setiap model.

Suatu model berada pada batas efisien ketika tidak ada model lain yang mempunyai Elo lebih tinggi dan harga lebih rendah atau sama. Perbatasan dihitung ulang seiring dengan pembaruan harga dan peringkat.

Kami sengaja tidak mempublikasikan rasio 'Elo per dolar': Elo adalah skala interval, jadi membaginya dengan harga tidak berarti secara statistik. Perbatasan adalah cara jujur untuk membandingkan kualitas dengan biaya.

Mengeksplorasi

Semua model →Papan harga →Perubahan harga →