实时
DEEPSEEK-V4-FL$0.20 26.3%
DEEPSEEK-V4-PR$0.87 4.6%
QWEN3.6-FLASH$1.13 24.9%
NEMOTRON-3-SUP$0.45 23.9%
LLAMA-4-MAVERI$0.60 11.9%
LLAMA-4-SCOUT$0.30 5.8%
GEMINI-3.1-FLA$1.50 10.0%
GEMINI-2.5-FLA$0.40 0.8%
MINIMAX-01$1.10 8.0%
MIMO-V2.5$0.28 5.8%
MIMO-V2.5-PRO$0.87 2.6%
MINIMAX-M3$1.20 6.1%
QWEN3.5-PLUS-2$1.80 6.0%
NOVA-2-LITE-V1$2.50 31.4%
GEMINI-2.5-FLA$2.50 9.5%
GROK-4.3$2.50 8.7%
QWEN3.6-PLUS$1.95 31.6%
NEMOTRON-3-ULT$2.50 25.9%
QWEN3.7-PLUS$1.60 21.4%
MINIMAX-M1$2.20 11.9%
PALMYRA-X5$6.00 26.9%
QWEN3.7-MAX$3.75 3.1%
GEMINI-3.5-FLA$9.00 8.3%
GEMINI-2.5-PRO$10.00 7.2%
GPT-5.4-NANO$1.25 10.0%
NOVA-LITE-V1$0.24 28.9%
KIMI-K2.5$1.90 9.8%
MINISTRAL-14B-$0.20 17.7%
DEEPSEEK-V4-FL$0.20 26.3%
DEEPSEEK-V4-PR$0.87 4.6%
QWEN3.6-FLASH$1.13 24.9%
NEMOTRON-3-SUP$0.45 23.9%
LLAMA-4-MAVERI$0.60 11.9%
LLAMA-4-SCOUT$0.30 5.8%
GEMINI-3.1-FLA$1.50 10.0%
GEMINI-2.5-FLA$0.40 0.8%
MINIMAX-01$1.10 8.0%
MIMO-V2.5$0.28 5.8%
MIMO-V2.5-PRO$0.87 2.6%
MINIMAX-M3$1.20 6.1%
QWEN3.5-PLUS-2$1.80 6.0%
NOVA-2-LITE-V1$2.50 31.4%
GEMINI-2.5-FLA$2.50 9.5%
GROK-4.3$2.50 8.7%
QWEN3.6-PLUS$1.95 31.6%
NEMOTRON-3-ULT$2.50 25.9%
QWEN3.7-PLUS$1.60 21.4%
MINIMAX-M1$2.20 11.9%
PALMYRA-X5$6.00 26.9%
QWEN3.7-MAX$3.75 3.1%
GEMINI-3.5-FLA$9.00 8.3%
GEMINI-2.5-PRO$10.00 7.2%
GPT-5.4-NANO$1.25 10.0%
NOVA-LITE-V1$0.24 28.9%
KIMI-K2.5$1.90 9.8%
MINISTRAL-14B-$0.20 17.7%
US文本LLAMA-3.3-70B- 实时 · 每日更新

Llama 3.3 70B Instruct

Meta
效率评分
89/100
8.9%
输入价格
$0.10/ 百万 Token
输出价格
$0.32/ 百万 Token
上下文窗口
131K
吞吐
149tok/s
可用性
100.0%
单任务成本
$0.000

能力

可接受输入
文本
可生成输出
文本

7 日热度走势

8.9%

价格拆解

输入价格
$0.10/ 百万 Token
$0.0001 / 千
输出价格
$0.32/ 百万 Token
$0.0003 / 千
混合价格
$0.27/ 百万 Token
$0.0003 / 千

典型 3:1 输出/输入比,每百万 Token

按负载估算每月成本

聊天助手
$68.40/ 月
输入1K · 输出400 · 1万次/天
RAG / 长上下文
$148.80/ 月
输入8K · 输出600 · 5千次/天
智能体 / 工具调用
$187.20/ 月
输入3K · 输出1.5K · 8千次/天
估算你的成本

市场定位

  • 比 71% 的收录模型更便宜
  • 比 48% 的收录模型更快
  • 效率排名: #51 共 120

最适合的场景

通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。

关于 Llama 3.3 70B Instruct

Llama 3.3 70B Instruct 是 Meta(US)推出的 文本 模型。HotON.ai 记录其输入价格为每百万 Token $0.10 美元、输出每百万 Token $0.32 美元,上下文窗口 131K Token,吞吐约 149 tokens/秒,可用性 100.0%。其综合效率评分为 89/100,单次成功任务成本约 $0.000 美元。

常见问题

Llama 3.3 70B Instruct 每百万 Token 多少钱?+

Llama 3.3 70B Instruct 的收录价格为输入 $0.10/百万 Token、输出 $0.32/百万 Token。按典型 3:1 输出/输入比,混合约 $0.27/百万 Token。数字为示意性演示数据。

Llama 3.3 70B Instruct 最适合做什么?+

通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。

Llama 3.3 70B Instruct 的速度如何?+

Llama 3.3 70B Instruct 约 149 tokens/秒,收录可用性 100.0%,适合对延迟敏感的实时应用。

Llama 3.3 70B Instruct 比其他模型便宜吗?+

在 HotON.ai 收录范围内,Llama 3.3 70B Instruct 的输入价格比 71% 的模型更便宜,综合效率排名第 51(共 120)。

价格与可用性为真实数据(来自 OpenRouter,每日更新;可用性取最优供应商近 24 小时正常运行率)。效率为基于真实价格与上下文的 HotON 综合评分。速度为模型估算。