Elo preferensi manusia nyata dari pemungutan suara head-to-head buta LMArena. Lebih tinggi lebih baik; — berarti belum mendapat peringkat di arena itu. Ini diukur, bukan perkiraan kami.
Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.
Campuran output-to-input 3:1, per 1 juta token
Sumber: litellm
Campuran beban kerja teks, gambar, audio, dan dokumen yang mendapat manfaat dari satu model di seluruh modalitas.
Azure OpenAI deployment reference for GPT-5.1 Chat preview; actual deployment name, API version, and region are customer-specific.
gpt-5.1-chat adalah model Multimoda dari Azure OpenAI (US). HotON.ai melacaknya pada $1.38 per 1 juta token masukan dan $11.00 per 1 juta token keluaran, dengan jendela konteks token 128K. Skor efisiensi gabungannya adalah 84/100 dengan perkiraan $0.008 per tugas yang berhasil.
gpt-5.1-chat dilacak pada $1.38 per 1 juta token masukan dan $11.00 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $8.60 per 1 juta token. Angka adalah ilustrasi data demo.
Campuran beban kerja teks, gambar, audio, dan dokumen yang mendapat manfaat dari satu model di seluruh modalitas.
gpt-5.1-chat mendukung hingga jendela konteks token 128K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.
Dalam rangkaian terlacak HotON.ai, gpt-5.1-chat lebih murah dibandingkan 21% model dalam hal harga input dan menempati peringkat #471 dari 521 berdasarkan efisiensi keseluruhan.
Ya — gpt-4.1-nano adalah opsi berbiaya lebih rendah di $0.40 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Multimoda yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.
Harga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Kecepatan, ketersediaan, dan efisiensi merupakan perkiraan yang dimodelkan.