US文本LLAMA-3.3-NEMO 实时 · 每日更新

Llama 3.3 Nemotron Super 49B V1.5

NVIDIA

效率评分

89/100

+2.4%

输入价格

$0.10/ 百万 Token

输出价格

$0.40/ 百万 Token

上下文窗口

131K

吞吐

123tok/s

可用性

100.0%

单任务成本

$0.000

能力

可接受输入

文本

可生成输出

文本

7 日热度走势

+2.4%

价格拆解

输入价格

$0.10/ 百万 Token

$0.0001 / 千

输出价格

$0.40/ 百万 Token

$0.0004 / 千

混合价格

$0.33/ 百万 Token

$0.0003 / 千

典型 3:1 输出/输入比,每百万 Token

按负载估算每月成本

聊天助手

$78.00/ 月

输入1K · 输出400 · 1万次/天

RAG / 长上下文

$156.00/ 月

输入8K · 输出600 · 5千次/天

智能体 / 工具调用

$216.00/ 月

输入3K · 输出1.5K · 8千次/天

估算你的成本 →

市场定位

比 71% 的收录模型更便宜
比 10% 的收录模型更快
效率排名: #66 共 120

最适合的场景

通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。

关于 Llama 3.3 Nemotron Super 49B V1.5

Llama 3.3 Nemotron Super 49B V1.5 是 NVIDIA(US)推出的文本模型。HotON.ai 记录其输入价格为每百万 Token $0.10 美元、输出每百万 Token $0.40 美元,上下文窗口 131K Token,吞吐约 123 tokens/秒,可用性 100.0%。其综合效率评分为 89/100,单次成功任务成本约 $0.000 美元。

对比 Llama 3.3 Nemotron Super 49B V1.5

LLAMA-3.3-NEMO vs LLAMA-3.3-70B-LLAMA-3.3-NEMO vs GRANITE-4.1-8B LLAMA-3.3-NEMO vs MINIMAX-M2.7 LLAMA-3.3-NEMO vs LFM-2-24B-A2B

常见问题

Llama 3.3 Nemotron Super 49B V1.5 每百万 Token 多少钱?+

Llama 3.3 Nemotron Super 49B V1.5 的收录价格为输入 $0.10/百万 Token、输出 $0.40/百万 Token。按典型 3:1 输出/输入比,混合约 $0.33/百万 Token。数字为示意性演示数据。

Llama 3.3 Nemotron Super 49B V1.5 最适合做什么?+

通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。

Llama 3.3 Nemotron Super 49B V1.5 的速度如何?+

Llama 3.3 Nemotron Super 49B V1.5 约 123 tokens/秒,收录可用性 100.0%,适合对延迟敏感的实时应用。

Llama 3.3 Nemotron Super 49B V1.5 比其他模型便宜吗?+

在 HotON.ai 收录范围内,Llama 3.3 Nemotron Super 49B V1.5 的输入价格比 71% 的模型更便宜,综合效率排名第 66(共 120)。