Giá sàn cho việc tạo văn bản có thể sử dụng đã sụp đổ. Trên các mô hình thế hệ trực tiếp 489, chúng tôi đã lập bản đồ mức độ thấp — và mức độ đông đúc — của đáy thị trường.
Mô hình thế hệ rẻ nhất mà chúng tôi theo dõi, Llama-3.2-3B-Instruct, chạy khoảng $0.020 trên 1 triệu mã thông báo theo tỷ lệ kết hợp 3:1. Đó không phải là lỗi đánh máy - các mô hình nhỏ, hiệu quả đã đẩy giá sàn xuống gần bằng 0 và chất lượng ở cấp thấp tiếp tục tăng lên.
234 của các mô hình thế hệ 489 hiện có giá dưới 1 USD cho mỗi 1 triệu token và 161 có giá dưới 0,5 USD. Trong khi đó, thứ mười đắt nhất trong danh mục là $49.94. Đối với công việc có khối lượng lớn, nhạy cảm về giá, bậc giá rẻ không còn là sự thỏa hiệp nữa - đó là mặc định.
Giá thấp nhất thường có nghĩa là các mô hình nhỏ hơn, bối cảnh ngắn hơn hoặc ít phương thức hơn - tốt cho việc định tuyến, phân loại, trích xuất và soạn thảo hàng loạt, ít hơn đối với lý do khó nhất. Hãy kết hợp mô hình với công việc: rẻ ở mức có thể, chỉ cao cấp ở mức có thể đo lường được. Bản đồ dưới đây thể hiện giá cả và hiệu quả.
Mỗi mô hình được theo dõi được vẽ theo giá đầu vào (thang đo log) và hiệu quả tổng hợp. Hướng về phía trên bên trái có nghĩa là giá trị trên mỗi đô la tốt hơn.
Mỗi dấu chấm là một mô hình · màu = vùng · nhấp vào dấu chấm để mở nó.
Giá cả là có thật (thông qua OpenRouter, được cập nhật hàng ngày). Đây là phân tích thị trường, không phải tư vấn đầu tư hay mua sắm.