CN推理ERNIE-4.5-21B- 实时 · 每日更新

ernie-4.5-21b-a3b-thinking

Baidu Wenxin

效率评分

89/100

−17.5%

输入价格

$0.07/ 百万 Token

输出价格

$0.28/ 百万 Token

上下文窗口

131K

吞吐

149tok/s

可用性

96.3%

单任务成本

$0.000

能力

可接受输入

文本

可生成输出

文本

7 日热度走势

−17.5%

价格拆解

输入价格

$0.07/ 百万 Token

$0.0001 / 千

输出价格

$0.28/ 百万 Token

$0.0003 / 千

混合价格

$0.23/ 百万 Token

$0.0002 / 千

典型 3:1 输出/输入比,每百万 Token

按负载估算每月成本

聊天助手

$54.60/ 月

输入1K · 输出400 · 1万次/天

RAG / 长上下文

$109.20/ 月

输入8K · 输出600 · 5千次/天

智能体 / 工具调用

$151.20/ 月

输入3K · 输出1.5K · 8千次/天

估算你的成本 →

市场定位

比 38% 的收录模型更便宜
比 53% 的收录模型更快
效率排名: #248 共 1105

最适合的场景

复杂推理、分析、规划与多步问题求解——答案质量比纯成本更重要的场景。

关于 ernie-4.5-21b-a3b-thinking

ERNIE 4.5 21B A3B Thinking 是 Baidu Wenxin 的文本大模型，面向文本生成和对话，上下文上限约 131,072 tokens。

ernie-4.5-21b-a3b-thinking 是 Baidu Wenxin(CN)推出的推理模型。HotON.ai 记录其输入价格为每百万 Token $0.07 美元、输出每百万 Token $0.28 美元,上下文窗口 131K Token,吞吐约 149 tokens/秒,可用性 96.3%。其综合效率评分为 89/100,单次成功任务成本约 $0.000 美元。

对比 ernie-4.5-21b-a3b-thinking

ERNIE-4.5-21B- vs DEEPSEEK-AI ERNIE-4.5-21B- vs -CF ERNIE-4.5-21B- vs DOLPHIN3.0-R1-ERNIE-4.5-21B- vs DEEPSEEK-AI

常见问题

ernie-4.5-21b-a3b-thinking 每百万 Token 多少钱?+

ernie-4.5-21b-a3b-thinking 的收录价格为输入 $0.07/百万 Token、输出 $0.28/百万 Token。按典型 3:1 输出/输入比,混合约 $0.23/百万 Token。数字为示意性演示数据。

ernie-4.5-21b-a3b-thinking 最适合做什么?+

复杂推理、分析、规划与多步问题求解——答案质量比纯成本更重要的场景。

ernie-4.5-21b-a3b-thinking 的速度如何?+

ernie-4.5-21b-a3b-thinking 约 149 tokens/秒,收录可用性 96.3%,适合对延迟敏感的实时应用。

ernie-4.5-21b-a3b-thinking 比其他模型便宜吗?+

在 HotON.ai 收录范围内,ernie-4.5-21b-a3b-thinking 的输入价格比 38% 的模型更便宜,综合效率排名第 248(共 1105)。