效率评分
89/100
−0.5%输入价格
$0.15/ 百万 Token
输出价格
$0.58/ 百万 Token
上下文窗口
131K
吞吐
130tok/s
可用性
99.4%
单任务成本
$0.001
能力
可接受输入
文本
可生成输出
文本
7 日热度走势
−0.5%价格拆解
输入价格
$0.15/ 百万 Token
$0.0001 / 千
输出价格
$0.58/ 百万 Token
$0.0006 / 千
混合价格
$0.47/ 百万 Token
$0.0005 / 千
典型 3:1 输出/输入比,每百万 Token
按负载估算每月成本
聊天助手
$114.60/ 月
输入1K · 输出400 · 1万次/天
RAG / 长上下文
$232.20/ 月
输入8K · 输出600 · 5千次/天
智能体 / 工具调用
$316.80/ 月
输入3K · 输出1.5K · 8千次/天
市场定位
- 比 31% 的收录模型更便宜
- 比 18% 的收录模型更快
- 效率排名: #495 共 1105
最适合的场景
复杂推理、分析、规划与多步问题求解——答案质量比纯成本更重要的场景。
关于 qwq-32b
QwQ 32B 是 Alibaba Cloud · Qwen 的文本大模型,面向文本生成和对话,上下文上限约 131,072 tokens。
qwq-32b 是 Alibaba Cloud · Qwen(CN)推出的 推理 模型。HotON.ai 记录其输入价格为每百万 Token $0.15 美元、输出每百万 Token $0.58 美元,上下文窗口 131K Token,吞吐约 130 tokens/秒,可用性 99.4%。其综合效率评分为 89/100,单次成功任务成本约 $0.001 美元。
相关市场资讯
常见问题
qwq-32b 每百万 Token 多少钱?+
qwq-32b 的收录价格为输入 $0.15/百万 Token、输出 $0.58/百万 Token。按典型 3:1 输出/输入比,混合约 $0.47/百万 Token。数字为示意性演示数据。
qwq-32b 最适合做什么?+
复杂推理、分析、规划与多步问题求解——答案质量比纯成本更重要的场景。
qwq-32b 的速度如何?+
qwq-32b 约 130 tokens/秒,收录可用性 99.4%,适合对延迟敏感的实时应用。
qwq-32b 比其他模型便宜吗?+
在 HotON.ai 收录范围内,qwq-32b 的输入价格比 31% 的模型更便宜,综合效率排名第 495(共 1105)。
相关模型
价格为真实数据(来自 TestKey 目录,每日更新)。质量(竞技场 Elo)在模型已上 LMArena 榜时为真实数据。速度、可用性与效率为模型估算。