CNMultimodaQWEN3-VL-FLASH Langsung · diperbarui setiap hari

qwen3-vl-flash

Alibaba Group

Skor efisiensi

90/100

Harga masukan

$0.05/ 1 juta token

Harga keluaran

$0.40/ 1 juta token

Jendela konteks

262K

Harga campuran

$0.31/ 1 juta token

Biaya / tugas

$0.000

Peringatan penurunan harga

Dapatkan email saat harga campuran model ini turun. Tidak diperlukan akun.

Satu email per tetes. Berhenti berlangganan kapan saja.

Kemampuan

Menerima (masukan)

Penglihatan

Menghasilkan (keluaran)

Teks

Harga seiring berjalannya waktu

Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.

Rincian harga

Harga masukan

$0.05/ 1 juta token

$0.0001 / 1K

Harga keluaran

$0.40/ 1 juta token

$0.0004 / 1K

Harga campuran

$0.31/ 1 juta token

$0.0003 / 1K

Campuran output-to-input 3:1, per 1 juta token

Harga pada 2026-05-11 · Sumber: alibaba_reference_catalog

Perkiraan biaya bulanan berdasarkan beban kerja

Asisten obrolan

$63.00/ bln

1 ribu masuk · 400 keluar · 10 ribu permintaan/hari

RAG / konteks panjang

$96.00/ bln

8 ribu masuk · 600 keluar · 5 ribu permintaan/hari

Penggunaan agen/alat

$180.00/ bln

3K masuk · 1,5K keluar · 8K permintaan/hari

Perkirakan biaya Anda →

Posisi pasar

Lebih murah daripada 91% model terlacak
Konteks lebih besar dibandingkan 73% model yang dilacak
Peringkat efisiensi: #65 dari 535

Paling cocok untuk

Campuran beban kerja teks, gambar, audio, dan dokumen yang mendapat manfaat dari satu model di seluruh modalitas.

Tentang qwen3-vl-flash

Alibaba Cloud Model Studio mencantumkan Qwen3 VL Flash sebagai model bahasa visi dengan latensi rendah untuk OCR dan rute pemahaman gambar.

qwen3-vl-flash adalah model Multimoda dari Alibaba Group (CN). HotON.ai melacaknya pada $0.05 per 1 juta token masukan dan $0.40 per 1 juta token keluaran, dengan jendela konteks token 262K. Skor efisiensi gabungannya adalah 90/100 dengan perkiraan $0.000 per tugas yang berhasil.

Bandingkan qwen3-vl-flash

QWEN3-VL-FLASH vs QWEN3.5-27B QWEN3-VL-FLASH vs MINISTRAL-8B-2 QWEN3-VL-FLASH vs SEED-1.6-FLASH QWEN3-VL-FLASH vs SEED-1.6

Berita pasar terkait

Amazon dilaporkan mengurangi model Nova AI-nya dan bertaruh pada tim peneliti Frontier baru2 jam yang lalu Agen Terkelola Gemini API: 3.6 Flash, hooks, dan banyak lagi2 jam yang lalu Cara memetakan ulang tombol Copilot pada keyboard Anda ke sesuatu yang lebih bermanfaat2 jam yang lalu

Pertanyaan yang sering diajukan

Berapa biaya qwen3-vl-flash per 1 juta token?+

qwen3-vl-flash dilacak pada $0.05 per 1 juta token masukan dan $0.40 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $0.31 per 1 juta token. Angka adalah ilustrasi data demo.

Untuk apa qwen3-vl-flash terbaik?+

Campuran beban kerja teks, gambar, audio, dan dokumen yang mendapat manfaat dari satu model di seluruh modalitas.

Seberapa besar jendela konteks qwen3-vl-flash?+

qwen3-vl-flash mendukung hingga jendela konteks token 262K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.

Apakah qwen3-vl-flash lebih murah dibandingkan model AI lainnya?+

Dalam rangkaian terlacak HotON.ai, qwen3-vl-flash lebih murah dibandingkan 91% model dalam hal harga input dan menempati peringkat #65 dari 535 berdasarkan efisiensi keseluruhan.

Apakah ada alternatif yang lebih murah selain qwen3-vl-flash?+

Ya — qwen3.5-flash-02-23 adalah opsi berbiaya lebih rendah di $0.26 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Multimoda yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.

Kutip model ini

Siap untuk ditempelkan ke dalam artikel, makalah, atau permintaan AI — harga dan tanggal diperbarui dengan data langsung.

HotON.ai — qwen3-vl-flash (Alibaba Group): $0.05/1M input, $0.40/1M output, as of 2026-05-11. https://hoton.ai/id/models/alibaba-qwen3-vl-flash

Model terkait

Harga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Efisiensi adalah gabungan harga riil dan konteks yang dimodelkan.

Harga seiring berjalannya waktu

Harga campuran harian ($/1 juta) — dicatat setiap hari, menjadi tren seiring berjalannya waktu.

Rincian harga

Harga masukan

$0.05/ 1 juta token

$0.0001 / 1K

Harga keluaran

$0.40/ 1 juta token

$0.0004 / 1K

Harga campuran

$0.31/ 1 juta token

$0.0003 / 1K

Campuran output-to-input 3:1, per 1 juta token

Perkiraan biaya bulanan berdasarkan beban kerja

Asisten obrolan

$63.00/ bln

1 ribu masuk · 400 keluar · 10 ribu permintaan/hari

RAG / konteks panjang

$96.00/ bln

8 ribu masuk · 600 keluar · 5 ribu permintaan/hari

Penggunaan agen/alat

$180.00/ bln

3K masuk · 1,5K keluar · 8K permintaan/hari

Perkirakan biaya Anda →

Paling cocok untuk

Campuran beban kerja teks, gambar, audio, dan dokumen yang mendapat manfaat dari satu model di seluruh modalitas.

Tentang qwen3-vl-flash

Alibaba Cloud Model Studio mencantumkan Qwen3 VL Flash sebagai model bahasa visi dengan latensi rendah untuk OCR dan rute pemahaman gambar.

Pertanyaan yang sering diajukan

Berapa biaya qwen3-vl-flash per 1 juta token?+

Untuk apa qwen3-vl-flash terbaik?+

Campuran beban kerja teks, gambar, audio, dan dokumen yang mendapat manfaat dari satu model di seluruh modalitas.

Seberapa besar jendela konteks qwen3-vl-flash?+

qwen3-vl-flash mendukung hingga jendela konteks token 262K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.

Apakah qwen3-vl-flash lebih murah dibandingkan model AI lainnya?+

Dalam rangkaian terlacak HotON.ai, qwen3-vl-flash lebih murah dibandingkan 91% model dalam hal harga input dan menempati peringkat #65 dari 535 berdasarkan efisiensi keseluruhan.

Apakah ada alternatif yang lebih murah selain qwen3-vl-flash?+