效率评分
89/100
−5.5%输入价格
$0.40/ 百万 Token
输出价格
$0.40/ 百万 Token
上下文窗口
131K
吞吐
127tok/s
可用性
98.1%
单任务成本
$0.001
能力
可接受输入
文本
可生成输出
文本
7 日热度走势
−5.5%价格拆解
输入价格
$0.40/ 百万 Token
$0.0004 / 千
输出价格
$0.40/ 百万 Token
$0.0004 / 千
混合价格
$0.40/ 百万 Token
$0.0004 / 千
典型 3:1 输出/输入比,每百万 Token
按负载估算每月成本
聊天助手
$168.00/ 月
输入1K · 输出400 · 1万次/天
RAG / 长上下文
$516.00/ 月
输入8K · 输出600 · 5千次/天
智能体 / 工具调用
$432.00/ 月
输入3K · 输出1.5K · 8千次/天
市场定位
- 比 20% 的收录模型更便宜
- 比 12% 的收录模型更快
- 效率排名: #367 共 1105
最适合的场景
通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。
关于 llama-3.1-70b-instruct
Llama 3.1 70B Instruct 是 Meta 的文本大模型,面向文本生成和对话,上下文上限约 131,072 tokens。
llama-3.1-70b-instruct 是 Meta(US)推出的 文本 模型。HotON.ai 记录其输入价格为每百万 Token $0.40 美元、输出每百万 Token $0.40 美元,上下文窗口 131K Token,吞吐约 127 tokens/秒,可用性 98.1%。其综合效率评分为 89/100,单次成功任务成本约 $0.001 美元。
对比 llama-3.1-70b-instruct
相关市场资讯
常见问题
llama-3.1-70b-instruct 每百万 Token 多少钱?+
llama-3.1-70b-instruct 的收录价格为输入 $0.40/百万 Token、输出 $0.40/百万 Token。按典型 3:1 输出/输入比,混合约 $0.40/百万 Token。数字为示意性演示数据。
llama-3.1-70b-instruct 最适合做什么?+
通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。
llama-3.1-70b-instruct 的速度如何?+
llama-3.1-70b-instruct 约 127 tokens/秒,收录可用性 98.1%,适合对延迟敏感的实时应用。
llama-3.1-70b-instruct 比其他模型便宜吗?+
在 HotON.ai 收录范围内,llama-3.1-70b-instruct 的输入价格比 20% 的模型更便宜,综合效率排名第 367(共 1105)。
相关模型
价格为真实数据(来自 TestKey 目录,每日更新)。质量(竞技场 Elo)在模型已上 LMArena 榜时为真实数据。速度、可用性与效率为模型估算。