效率评分
89/100
+2.4%输入价格
$0.10/ 百万 Token
输出价格
$0.40/ 百万 Token
上下文窗口
131K
吞吐
123tok/s
可用性
100.0%
单任务成本
$0.000
能力
可接受输入
文本
可生成输出
文本
7 日热度走势
+2.4%价格拆解
输入价格
$0.10/ 百万 Token
$0.0001 / 千
输出价格
$0.40/ 百万 Token
$0.0004 / 千
混合价格
$0.33/ 百万 Token
$0.0003 / 千
典型 3:1 输出/输入比,每百万 Token
按负载估算每月成本
聊天助手
$78.00/ 月
输入1K · 输出400 · 1万次/天
RAG / 长上下文
$156.00/ 月
输入8K · 输出600 · 5千次/天
智能体 / 工具调用
$216.00/ 月
输入3K · 输出1.5K · 8千次/天
市场定位
- 比 71% 的收录模型更便宜
- 比 10% 的收录模型更快
- 效率排名: #66 共 120
最适合的场景
通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。
关于 Llama 3.3 Nemotron Super 49B V1.5
Llama 3.3 Nemotron Super 49B V1.5 是 NVIDIA(US)推出的 文本 模型。HotON.ai 记录其输入价格为每百万 Token $0.10 美元、输出每百万 Token $0.40 美元,上下文窗口 131K Token,吞吐约 123 tokens/秒,可用性 100.0%。其综合效率评分为 89/100,单次成功任务成本约 $0.000 美元。
对比 Llama 3.3 Nemotron Super 49B V1.5
相关市场资讯
常见问题
Llama 3.3 Nemotron Super 49B V1.5 每百万 Token 多少钱?+
Llama 3.3 Nemotron Super 49B V1.5 的收录价格为输入 $0.10/百万 Token、输出 $0.40/百万 Token。按典型 3:1 输出/输入比,混合约 $0.33/百万 Token。数字为示意性演示数据。
Llama 3.3 Nemotron Super 49B V1.5 最适合做什么?+
通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。
Llama 3.3 Nemotron Super 49B V1.5 的速度如何?+
Llama 3.3 Nemotron Super 49B V1.5 约 123 tokens/秒,收录可用性 100.0%,适合对延迟敏感的实时应用。
Llama 3.3 Nemotron Super 49B V1.5 比其他模型便宜吗?+
在 HotON.ai 收录范围内,Llama 3.3 Nemotron Super 49B V1.5 的输入价格比 71% 的模型更便宜,综合效率排名第 66(共 120)。
相关模型
价格与可用性为真实数据(来自 OpenRouter,每日更新;可用性取最优供应商近 24 小时正常运行率)。效率为基于真实价格与上下文的 HotON 综合评分。速度为模型估算。