Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.
Campuran output-to-input 3:1, per 1 juta token
Harga pada 2026-04-28 · Sumber: legacy_model_catalog
Penalaran, analisis, perencanaan, dan pemecahan masalah multi-langkah yang kompleks di mana kualitas jawaban lebih penting daripada biaya mentah.
Qwen Plus 0728, based on the Qwen3 foundation model, is a 1 million context hybrid reasoning model with a balanced performance, speed, and cost combination.
qwen-plus-2025-07-28:thinking adalah model Pemikiran dari Alibaba Cloud · Qwen (CN). HotON.ai melacaknya pada $0.26 per 1 juta token masukan dan $0.78 per 1 juta token keluaran, dengan jendela konteks token 1000K. Skor efisiensi gabungannya adalah 96/100 dengan perkiraan $0.001 per tugas yang berhasil.
qwen-plus-2025-07-28:thinking dilacak pada $0.26 per 1 juta token masukan dan $0.78 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $0.65 per 1 juta token. Angka adalah ilustrasi data demo.
Penalaran, analisis, perencanaan, dan pemecahan masalah multi-langkah yang kompleks di mana kualitas jawaban lebih penting daripada biaya mentah.
qwen-plus-2025-07-28:thinking mendukung hingga jendela konteks token 1000K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.
Dalam rangkaian terlacak HotON.ai, qwen-plus-2025-07-28:thinking lebih murah dibandingkan 56% model dalam hal harga input dan menempati peringkat #5 dari 521 berdasarkan efisiensi keseluruhan.
Ya — grok-4-1-fast-non-reasoning adalah opsi berbiaya lebih rendah di $0.50 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Pemikiran yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.
Harga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Kecepatan, ketersediaan, dan efisiensi merupakan perkiraan yang dimodelkan.