US文本NVIDIA 实时 · 每日更新

nvidia/Nemotron-120B-A12B

Baseten Model APIs

效率评分

90/100

−28.9%

输入价格

$0.30/ 百万 Token

输出价格

$0.75/ 百万 Token

上下文窗口

202K

吞吐

147tok/s

可用性

96.6%

单任务成本

$0.001

能力

可接受输入

文本

可生成输出

文本

7 日热度走势

−28.9%

价格拆解

输入价格

$0.30/ 百万 Token

$0.0003 / 千

输出价格

$0.75/ 百万 Token

$0.0008 / 千

混合价格

$0.64/ 百万 Token

$0.0006 / 千

典型 3:1 输出/输入比,每百万 Token

按负载估算每月成本

聊天助手

$180.00/ 月

输入1K · 输出400 · 1万次/天

RAG / 长上下文

$427.50/ 月

输入8K · 输出600 · 5千次/天

智能体 / 工具调用

$486.00/ 月

输入3K · 输出1.5K · 8千次/天

估算你的成本 →

市场定位

比 22% 的收录模型更便宜
比 48% 的收录模型更快
效率排名: #134 共 1105

最适合的场景

通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。

关于 nvidia/Nemotron-120B-A12B

Nemotron Super on Baseten 是 Baseten Model APIs 的文本大模型，面向文本生成和对话，上下文上限约 202,000 tokens。

nvidia/Nemotron-120B-A12B 是 Baseten Model APIs(US)推出的文本模型。HotON.ai 记录其输入价格为每百万 Token $0.30 美元、输出每百万 Token $0.75 美元,上下文窗口 202K Token,吞吐约 147 tokens/秒,可用性 96.6%。其综合效率评分为 90/100,单次成功任务成本约 $0.001 美元。

对比 nvidia/Nemotron-120B-A12B

NVIDIA vs ACCOUNTS NVIDIA vs JAMBA-MINI-1.7 NVIDIA vs JAMBA-MINI-2 NVIDIA vs HUNYUAN-LITE

常见问题

nvidia/Nemotron-120B-A12B 每百万 Token 多少钱?+

nvidia/Nemotron-120B-A12B 的收录价格为输入 $0.30/百万 Token、输出 $0.75/百万 Token。按典型 3:1 输出/输入比,混合约 $0.64/百万 Token。数字为示意性演示数据。

nvidia/Nemotron-120B-A12B 最适合做什么?+

通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。

nvidia/Nemotron-120B-A12B 的速度如何?+

nvidia/Nemotron-120B-A12B 约 147 tokens/秒,收录可用性 96.6%,适合对延迟敏感的实时应用。

nvidia/Nemotron-120B-A12B 比其他模型便宜吗?+

在 HotON.ai 收录范围内,nvidia/Nemotron-120B-A12B 的输入价格比 22% 的模型更便宜,综合效率排名第 134(共 1105)。