实时
BODYBUILDER$-1000000.00 5.4%
MINIMAX-M2.7$1.20 7.2%
QWEN-PLUS-2025$0.78 28.3%
DEEPSEEK-AI$0.00 27.0%
GPT-4.1-NANO$0.40 13.0%
GLM-4-LONG$0.00 14.1%
GROK-4.1-FAST$0.50 16.4%
GROK-4-FAST-RE$0.50 17.1%
GOOGLE$0.00 13.0%
LLAMA-4-MAVERI$0.60 11.9%
GROK-4-FAST-NO$0.50 14.3%
GROK-4-FAST$0.50 6.0%
GROK-4-1-FAST-$0.50 31.2%
MINIMAX-M2.5$0.99 10.7%
GOOGLE$1.50 3.4%
GOOGLE$0.00 27.8%
XAI$0.00 4.5%
-CF$0.00 9.7%
GEMINI-3.1-FLA$1.50 9.4%
MINIMAX-M2.7$0.00 9.9%
GPT-4.1-MINI-2$1.60 31.8%
DEEPSEEK$0.28 2.2%
LYRIA-3-PRO-PR$0.00 29.4%
LYRIA-3-CLIP-P$0.00 22.9%
MINIMAX-M2.1$0.95 2.6%
MINIMAX-01$1.10 8.0%
MINIMAX-M3$1.20 6.1%
GEMINI-2.5-FLA$0.40 28.8%
BODYBUILDER$-1000000.00 5.4%
MINIMAX-M2.7$1.20 7.2%
QWEN-PLUS-2025$0.78 28.3%
DEEPSEEK-AI$0.00 27.0%
GPT-4.1-NANO$0.40 13.0%
GLM-4-LONG$0.00 14.1%
GROK-4.1-FAST$0.50 16.4%
GROK-4-FAST-RE$0.50 17.1%
GOOGLE$0.00 13.0%
LLAMA-4-MAVERI$0.60 11.9%
GROK-4-FAST-NO$0.50 14.3%
GROK-4-FAST$0.50 6.0%
GROK-4-1-FAST-$0.50 31.2%
MINIMAX-M2.5$0.99 10.7%
GOOGLE$1.50 3.4%
GOOGLE$0.00 27.8%
XAI$0.00 4.5%
-CF$0.00 9.7%
GEMINI-3.1-FLA$1.50 9.4%
MINIMAX-M2.7$0.00 9.9%
GPT-4.1-MINI-2$1.60 31.8%
DEEPSEEK$0.28 2.2%
LYRIA-3-PRO-PR$0.00 29.4%
LYRIA-3-CLIP-P$0.00 22.9%
MINIMAX-M2.1$0.95 2.6%
MINIMAX-01$1.10 8.0%
MINIMAX-M3$1.20 6.1%
GEMINI-2.5-FLA$0.40 28.8%
US文本LLAMA-3.1-NEMO 实时 · 每日更新

llama-3.1-nemotron-ultra-253b-v1

NVIDIA
效率评分
89/100
0.6%
输入价格
$0.60/ 百万 Token
输出价格
$1.80/ 百万 Token
上下文窗口
131K
吞吐
151tok/s
可用性
98.5%
单任务成本
$0.002

能力

可接受输入
文本
可生成输出
文本

7 日热度走势

0.6%

价格拆解

输入价格
$0.60/ 百万 Token
$0.0006 / 千
输出价格
$1.80/ 百万 Token
$0.0018 / 千
混合价格
$1.50/ 百万 Token
$0.0015 / 千

典型 3:1 输出/输入比,每百万 Token

按负载估算每月成本

聊天助手
$396.00/ 月
输入1K · 输出400 · 1万次/天
RAG / 长上下文
$882.00/ 月
输入8K · 输出600 · 5千次/天
智能体 / 工具调用
$1,080/ 月
输入3K · 输出1.5K · 8千次/天
估算你的成本

市场定位

  • 比 17% 的收录模型更便宜
  • 比 56% 的收录模型更快
  • 效率排名: #394 共 1105

最适合的场景

通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。

关于 llama-3.1-nemotron-ultra-253b-v1

Llama 3.1 Nemotron Ultra 253B v1 是 NVIDIA 的文本大模型,面向文本生成和对话,上下文上限约 131,072 tokens。

llama-3.1-nemotron-ultra-253b-v1 是 NVIDIA(US)推出的 文本 模型。HotON.ai 记录其输入价格为每百万 Token $0.60 美元、输出每百万 Token $1.80 美元,上下文窗口 131K Token,吞吐约 151 tokens/秒,可用性 98.5%。其综合效率评分为 89/100,单次成功任务成本约 $0.002 美元。

常见问题

llama-3.1-nemotron-ultra-253b-v1 每百万 Token 多少钱?+

llama-3.1-nemotron-ultra-253b-v1 的收录价格为输入 $0.60/百万 Token、输出 $1.80/百万 Token。按典型 3:1 输出/输入比,混合约 $1.50/百万 Token。数字为示意性演示数据。

llama-3.1-nemotron-ultra-253b-v1 最适合做什么?+

通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。

llama-3.1-nemotron-ultra-253b-v1 的速度如何?+

llama-3.1-nemotron-ultra-253b-v1 约 151 tokens/秒,收录可用性 98.5%,适合对延迟敏感的实时应用。

llama-3.1-nemotron-ultra-253b-v1 比其他模型便宜吗?+

在 HotON.ai 收录范围内,llama-3.1-nemotron-ultra-253b-v1 的输入价格比 17% 的模型更便宜,综合效率排名第 394(共 1105)。

价格为真实数据(来自 TestKey 目录,每日更新)。质量(竞技场 Elo)在模型已上 LMArena 榜时为真实数据。速度、可用性与效率为模型估算。