Giá cao hơn không đảm bảo một mô hình thông minh hơn. Trong số các mẫu 31 có điểm LMArena công khai, chúng tôi đã xếp hạng Elo chuẩn thực so với giá thực.
minimax-m3 chấm điểm 1448 trên bảng xếp hạng tùy chọn con người của LMArena trong khi chỉ tốn khoảng $0.97 cho mỗi 1 triệu mã thông báo trên tỷ lệ kết hợp 3:1 — trong một vài điểm so với những mô hình tốt nhất với mức giá chỉ bằng một phần nhỏ. Điểm chuẩn Elo là dữ liệu thực của bên thứ ba, không phải ước tính của chúng tôi.
Mô hình có điểm cao nhất mà chúng tôi theo dõi, claude-opus-4.6, đăng Elo của 1504 ở mức khoảng $20.00 trên 1 triệu. Những người dẫn đầu giá trị đạt được chất lượng rất gần trong khi định giá thấp hơn nhiều — vì vậy, đối với hầu hết khối lượng công việc, bạn đang phải trả một khoản phí lớn cho sự khác biệt nhỏ về chất lượng, thường không thể nhận thấy.
Trí thông minh trên mỗi đô la ủng hộ các mô hình vừa mạnh vừa rẻ; coi nó như một bộ lọc bắt đầu, không phải từ cuối cùng - độ trễ, cửa sổ ngữ cảnh, cách sử dụng công cụ và các đánh giá của riêng bạn vẫn quan trọng. Hiện chỉ có các mẫu 31 mới có điểm LMArena công khai, do đó, điều này xếp hạng trường được đo chứ không phải toàn bộ danh mục. Bản đồ dưới đây thể hiện giá cả và hiệu quả.
Mỗi mô hình được theo dõi được vẽ theo giá đầu vào (thang đo log) và hiệu quả tổng hợp. Hướng về phía trên bên trái có nghĩa là giá trị trên mỗi đô la tốt hơn.
Mỗi dấu chấm là một mô hình · màu = vùng · nhấp vào dấu chấm để mở nó.
Giá là có thật (thông qua OpenRouter, được cập nhật hàng ngày) và Elo là có thật (thông qua LMArena). Đây là phân tích thị trường, không phải tư vấn đầu tư hay mua sắm.