CN多模态QWEN3-VL-FLASH 实时 · 每日更新

qwen3-vl-flash

Alibaba Group

效率评分

90/100

−10.5%

输入价格

$0.05/ 百万 Token

输出价格

$0.40/ 百万 Token

上下文窗口

262K

吞吐

154tok/s

可用性

97.8%

单任务成本

$0.000

能力

可接受输入

图像

可生成输出

文本

7 日热度走势

−10.5%

价格拆解

输入价格

$0.05/ 百万 Token

$0.0001 / 千

输出价格

$0.40/ 百万 Token

$0.0004 / 千

混合价格

$0.31/ 百万 Token

$0.0003 / 千

典型 3:1 输出/输入比,每百万 Token

按负载估算每月成本

聊天助手

$63.00/ 月

输入1K · 输出400 · 1万次/天

RAG / 长上下文

$96.00/ 月

输入8K · 输出600 · 5千次/天

智能体 / 工具调用

$180.00/ 月

输入3K · 输出1.5K · 8千次/天

估算你的成本 →

市场定位

比 40% 的收录模型更便宜
比 62% 的收录模型更快
效率排名: #124 共 1105

最适合的场景

文本、图像、音频与文档混合负载,适合用一个模型覆盖多模态。

关于 qwen3-vl-flash

Alibaba Cloud Qwen3 VL Flash 是 Alibaba Group 的多模态模型，面向视觉理解和文本生成，上下文上限约 262,144 tokens。

qwen3-vl-flash 是 Alibaba Group(CN)推出的多模态模型。HotON.ai 记录其输入价格为每百万 Token $0.05 美元、输出每百万 Token $0.40 美元,上下文窗口 262K Token,吞吐约 154 tokens/秒,可用性 97.8%。其综合效率评分为 90/100,单次成功任务成本约 $0.000 美元。

对比 qwen3-vl-flash

QWEN3-VL-FLASH vs GEMMA-4-26B-A4 QWEN3-VL-FLASH vs MINISTRAL-8B-2 QWEN3-VL-FLASH vs GEMMA-4-26B-A4 QWEN3-VL-FLASH vs QWEN3.5-9B

常见问题

qwen3-vl-flash 每百万 Token 多少钱?+

qwen3-vl-flash 的收录价格为输入 $0.05/百万 Token、输出 $0.40/百万 Token。按典型 3:1 输出/输入比,混合约 $0.31/百万 Token。数字为示意性演示数据。

qwen3-vl-flash 最适合做什么?+

文本、图像、音频与文档混合负载,适合用一个模型覆盖多模态。

qwen3-vl-flash 的速度如何?+

qwen3-vl-flash 约 154 tokens/秒,收录可用性 97.8%,适合对延迟敏感的实时应用。

qwen3-vl-flash 比其他模型便宜吗?+

在 HotON.ai 收录范围内,qwen3-vl-flash 的输入价格比 40% 的模型更便宜,综合效率排名第 124(共 1105)。