nvidia/Nemotron-120B-A12B 对比 accounts/fireworks/models/minimax-m2p5
输入价格
$0.30
$0.30
输出价格
$0.75
$1.20
上下文窗口
202K
229K
吞吐
147 tok/s
139 tok/s
可用性
96.6%
98.8%
单任务成本
$0.001
$0.001
效率评分
90
90
按负载估算每月成本
指标
NVIDIA
ACCOUNTS
聊天助手
$180.00
$234.00
RAG / 长上下文
$427.50
$468.00
智能体 / 工具调用
$486.00
$648.00
效率评分: nvidia/Nemotron-120B-A12B
综合价格、速度与可靠性,nvidia/Nemotron-120B-A12B 在多数负载下整体更均衡——但最终取舍取决于你输入、输出与延迟的具体配比。
数据为示意性演示数据,不构成投资建议。
常见问题
nvidia/Nemotron-120B-A12B 和 accounts/fireworks/models/minimax-m2p5 哪个更便宜?+
nvidia/Nemotron-120B-A12B 的输入价格更低——$0.30 vs $0.30/百万 Token——多数混合负载下它是两者中更划算的。数字为示意性演示数据。
nvidia/Nemotron-120B-A12B 和 accounts/fireworks/models/minimax-m2p5 该选哪个?+
综合价格、速度与可靠性,nvidia/Nemotron-120B-A12B 在多数负载下整体更均衡——但最终取舍取决于你输入、输出与延迟的具体配比。