Memadukan $/1 juta di seluruh versi terlacak dari baris ini.
Campuran output-to-input 3:1, per 1 juta token
Harga pada 2026-04-28 · Sumber: legacy_model_catalog
Campuran beban kerja teks, gambar, audio, dan dokumen yang mendapat manfaat dari satu model di seluruh modalitas.
Qwen2.5-VL-32B is a multimodal vision-language model fine-tuned through reinforcement learning for enhanced mathematical reasoning, structured outputs, and visual problem-solving capabilities. It excels at visual anal...
qwen2.5-vl-32b-instruct adalah model Multimoda dari Alibaba Cloud · Qwen (CN). HotON.ai melacaknya pada $0.20 per 1 juta token masukan dan $0.60 per 1 juta token keluaran, dengan jendela konteks token 128K. Skor efisiensi gabungannya adalah 89/100 dengan perkiraan $0.001 per tugas yang berhasil.
qwen2.5-vl-32b-instruct dilacak pada $0.20 per 1 juta token masukan dan $0.60 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $0.50 per 1 juta token. Angka adalah ilustrasi data demo.
Campuran beban kerja teks, gambar, audio, dan dokumen yang mendapat manfaat dari satu model di seluruh modalitas.
qwen2.5-vl-32b-instruct mendukung hingga jendela konteks token 128K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.
Dalam rangkaian terlacak HotON.ai, qwen2.5-vl-32b-instruct lebih murah dibandingkan 62% model dalam hal harga input dan menempati peringkat #199 dari 521 berdasarkan efisiensi keseluruhan.
Ya — gpt-4.1-nano adalah opsi berbiaya lebih rendah di $0.40 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Multimoda yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.
Harga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Kecepatan, ketersediaan, dan efisiensi merupakan perkiraan yang dimodelkan.