Elo ưu tiên thực sự của con người từ các cuộc bỏ phiếu trực tiếp mù quáng của LMArena. Cao hơn là tốt hơn; — có nghĩa là chưa được xếp hạng trong đấu trường đó. Điều này được đo lường, không phải ước tính của chúng tôi.
Giá hỗn hợp hàng ngày ($/1 triệu) — được ghi lại mỗi ngày, hình thành xu hướng theo thời gian.
Tỷ lệ kết hợp đầu ra-đầu vào 3:1 điển hình trên mỗi 1M token
Nguồn: litellm
Khối lượng công việc văn bản, hình ảnh, âm thanh và tài liệu hỗn hợp được hưởng lợi từ một mô hình trên nhiều phương thức.
Azure OpenAI deployment reference for GPT-5.1 Chat preview; actual deployment name, API version, and region are customer-specific.
gpt-5.1-chat là mẫu Đa phương thức của Azure OpenAI (US). HotON.ai theo dõi nó ở mức $1.38 trên 1 triệu mã thông báo đầu vào và $11.00 trên 1 triệu mã thông báo đầu ra, với cửa sổ ngữ cảnh mã thông báo 128K. Điểm hiệu quả tổng hợp của nó là 84/100 ở mức $0.008 ước tính cho mỗi nhiệm vụ thành công.
gpt-5.1-chat được theo dõi ở mức $1.38 trên 1 triệu mã thông báo đầu vào và $11.00 trên 1 triệu mã thông báo đầu ra. Khối lượng công việc đầu ra-đầu vào 3:1 điển hình pha trộn với khoảng $8.60 trên mỗi 1 triệu mã thông báo. Số liệu là dữ liệu demo minh họa.
Khối lượng công việc văn bản, hình ảnh, âm thanh và tài liệu hỗn hợp được hưởng lợi từ một mô hình trên nhiều phương thức.
gpt-5.1-chat hỗ trợ tối đa cửa sổ ngữ cảnh mã thông báo 128K - đủ lớn cho các tài liệu dài và các cuộc hội thoại mở rộng trong một yêu cầu.
Trong nhóm theo dõi HotON.ai, gpt-5.1-chat rẻ hơn 21% so với 21% về giá đầu vào và xếp hạng #471 của 521 theo hiệu suất tổng thể.
Có — gpt-4.1-nano là một tùy chọn có chi phí thấp hơn ở mức $0.40 trên mỗi 1 triệu mã thông báo đầu ra, trong khi vẫn đáp ứng các trường hợp sử dụng Đa phương thức tương tự. So sánh chúng cạnh nhau trên HotON.ai.
Giá cả là có thật (thông qua danh mục TestKey, được cập nhật hàng ngày). Chất lượng (Arena Elo) là có thật khi mẫu xe được xếp hạng trên LMArena. Tốc độ, tính sẵn có và hiệu quả là những ước tính được mô hình hóa.