效率评分
90/100
−28.9%输入价格
$0.30/ 百万 Token
输出价格
$0.75/ 百万 Token
上下文窗口
202K
吞吐
147tok/s
可用性
96.6%
单任务成本
$0.001
能力
可接受输入
文本
可生成输出
文本
7 日热度走势
−28.9%价格拆解
输入价格
$0.30/ 百万 Token
$0.0003 / 千
输出价格
$0.75/ 百万 Token
$0.0008 / 千
混合价格
$0.64/ 百万 Token
$0.0006 / 千
典型 3:1 输出/输入比,每百万 Token
按负载估算每月成本
聊天助手
$180.00/ 月
输入1K · 输出400 · 1万次/天
RAG / 长上下文
$427.50/ 月
输入8K · 输出600 · 5千次/天
智能体 / 工具调用
$486.00/ 月
输入3K · 输出1.5K · 8千次/天
市场定位
- 比 22% 的收录模型更便宜
- 比 48% 的收录模型更快
- 效率排名: #134 共 1105
最适合的场景
通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。
关于 nvidia/Nemotron-120B-A12B
Nemotron Super on Baseten 是 Baseten Model APIs 的文本大模型,面向文本生成和对话,上下文上限约 202,000 tokens。
nvidia/Nemotron-120B-A12B 是 Baseten Model APIs(US)推出的 文本 模型。HotON.ai 记录其输入价格为每百万 Token $0.30 美元、输出每百万 Token $0.75 美元,上下文窗口 202K Token,吞吐约 147 tokens/秒,可用性 96.6%。其综合效率评分为 90/100,单次成功任务成本约 $0.001 美元。
对比 nvidia/Nemotron-120B-A12B
相关市场资讯
常见问题
nvidia/Nemotron-120B-A12B 每百万 Token 多少钱?+
nvidia/Nemotron-120B-A12B 的收录价格为输入 $0.30/百万 Token、输出 $0.75/百万 Token。按典型 3:1 输出/输入比,混合约 $0.64/百万 Token。数字为示意性演示数据。
nvidia/Nemotron-120B-A12B 最适合做什么?+
通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。
nvidia/Nemotron-120B-A12B 的速度如何?+
nvidia/Nemotron-120B-A12B 约 147 tokens/秒,收录可用性 96.6%,适合对延迟敏感的实时应用。
nvidia/Nemotron-120B-A12B 比其他模型便宜吗?+
在 HotON.ai 收录范围内,nvidia/Nemotron-120B-A12B 的输入价格比 22% 的模型更便宜,综合效率排名第 134(共 1105)。
相关模型
价格为真实数据(来自 TestKey 目录,每日更新)。质量(竞技场 Elo)在模型已上 LMArena 榜时为真实数据。速度、可用性与效率为模型估算。