Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.
Campuran output-to-input 3:1, per 1 juta token
Harga pada 2026-05-11 · Sumber: alibaba_reference_catalog
Pembuatan kode, pemfaktoran ulang dan peninjauan, serta beban kerja peralatan pengembang dengan konteks luas.
Alibaba Cloud Model Studio lists Qwen3 Coder Flash as a lower-latency coder route for code and tool-use workloads.
qwen3-coder-flash adalah model Kode dari Alibaba Group (CN). HotON.ai melacaknya pada $0.30 per 1 juta token masukan dan $1.50 per 1 juta token keluaran, dengan jendela konteks token 1000K. Skor efisiensi gabungannya adalah 95/100 dengan perkiraan $0.001 per tugas yang berhasil.
qwen3-coder-flash dilacak pada $0.30 per 1 juta token masukan dan $1.50 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $1.20 per 1 juta token. Angka adalah ilustrasi data demo.
Pembuatan kode, pemfaktoran ulang dan peninjauan, serta beban kerja peralatan pengembang dengan konteks luas.
qwen3-coder-flash mendukung hingga jendela konteks token 1000K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.
Dalam rangkaian terlacak HotON.ai, qwen3-coder-flash lebih murah dibandingkan 50% model dalam hal harga input dan menempati peringkat #32 dari 521 berdasarkan efisiensi keseluruhan.
Ya — qwen3-coder-flash adalah opsi berbiaya lebih rendah di $0.98 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Kode yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.
Harga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Kecepatan, ketersediaan, dan efisiensi merupakan perkiraan yang dimodelkan.