效率评分
90/100
−10.5%输入价格
$0.05/ 百万 Token
输出价格
$0.40/ 百万 Token
上下文窗口
262K
吞吐
154tok/s
可用性
97.8%
单任务成本
$0.000
能力
可接受输入
图像
可生成输出
文本
7 日热度走势
−10.5%价格拆解
输入价格
$0.05/ 百万 Token
$0.0001 / 千
输出价格
$0.40/ 百万 Token
$0.0004 / 千
混合价格
$0.31/ 百万 Token
$0.0003 / 千
典型 3:1 输出/输入比,每百万 Token
按负载估算每月成本
聊天助手
$63.00/ 月
输入1K · 输出400 · 1万次/天
RAG / 长上下文
$96.00/ 月
输入8K · 输出600 · 5千次/天
智能体 / 工具调用
$180.00/ 月
输入3K · 输出1.5K · 8千次/天
市场定位
- 比 40% 的收录模型更便宜
- 比 62% 的收录模型更快
- 效率排名: #124 共 1105
最适合的场景
文本、图像、音频与文档混合负载,适合用一个模型覆盖多模态。
关于 qwen3-vl-flash
Alibaba Cloud Qwen3 VL Flash 是 Alibaba Group 的多模态模型,面向视觉理解和文本生成,上下文上限约 262,144 tokens。
qwen3-vl-flash 是 Alibaba Group(CN)推出的 多模态 模型。HotON.ai 记录其输入价格为每百万 Token $0.05 美元、输出每百万 Token $0.40 美元,上下文窗口 262K Token,吞吐约 154 tokens/秒,可用性 97.8%。其综合效率评分为 90/100,单次成功任务成本约 $0.000 美元。
对比 qwen3-vl-flash
相关市场资讯
常见问题
qwen3-vl-flash 每百万 Token 多少钱?+
qwen3-vl-flash 的收录价格为输入 $0.05/百万 Token、输出 $0.40/百万 Token。按典型 3:1 输出/输入比,混合约 $0.31/百万 Token。数字为示意性演示数据。
qwen3-vl-flash 最适合做什么?+
文本、图像、音频与文档混合负载,适合用一个模型覆盖多模态。
qwen3-vl-flash 的速度如何?+
qwen3-vl-flash 约 154 tokens/秒,收录可用性 97.8%,适合对延迟敏感的实时应用。
qwen3-vl-flash 比其他模型便宜吗?+
在 HotON.ai 收录范围内,qwen3-vl-flash 的输入价格比 40% 的模型更便宜,综合效率排名第 124(共 1105)。
相关模型
价格为真实数据(来自 TestKey 目录,每日更新)。质量(竞技场 Elo)在模型已上 LMArena 榜时为真实数据。速度、可用性与效率为模型估算。