实时
DEEPSEEK-V4-FL$0.20 26.3%
DEEPSEEK-V4-PR$0.87 4.6%
QWEN3.6-FLASH$1.13 24.9%
NEMOTRON-3-SUP$0.45 23.9%
LLAMA-4-MAVERI$0.60 11.9%
LLAMA-4-SCOUT$0.30 5.8%
GEMINI-3.1-FLA$1.50 10.0%
GEMINI-2.5-FLA$0.40 0.8%
MINIMAX-01$1.10 8.0%
MIMO-V2.5$0.28 5.8%
MIMO-V2.5-PRO$0.87 2.6%
MINIMAX-M3$1.20 6.1%
QWEN3.5-PLUS-2$1.80 6.0%
NOVA-2-LITE-V1$2.50 31.4%
GEMINI-2.5-FLA$2.50 9.5%
GROK-4.3$2.50 8.7%
QWEN3.6-PLUS$1.95 31.6%
NEMOTRON-3-ULT$2.50 25.9%
QWEN3.7-PLUS$1.60 21.4%
MINIMAX-M1$2.20 11.9%
PALMYRA-X5$6.00 26.9%
QWEN3.7-MAX$3.75 3.1%
GEMINI-3.5-FLA$9.00 8.3%
GEMINI-2.5-PRO$10.00 7.2%
GPT-5.4-NANO$1.25 10.0%
NOVA-LITE-V1$0.24 28.9%
KIMI-K2.5$1.90 9.8%
MINISTRAL-14B-$0.20 17.7%
DEEPSEEK-V4-FL$0.20 26.3%
DEEPSEEK-V4-PR$0.87 4.6%
QWEN3.6-FLASH$1.13 24.9%
NEMOTRON-3-SUP$0.45 23.9%
LLAMA-4-MAVERI$0.60 11.9%
LLAMA-4-SCOUT$0.30 5.8%
GEMINI-3.1-FLA$1.50 10.0%
GEMINI-2.5-FLA$0.40 0.8%
MINIMAX-01$1.10 8.0%
MIMO-V2.5$0.28 5.8%
MIMO-V2.5-PRO$0.87 2.6%
MINIMAX-M3$1.20 6.1%
QWEN3.5-PLUS-2$1.80 6.0%
NOVA-2-LITE-V1$2.50 31.4%
GEMINI-2.5-FLA$2.50 9.5%
GROK-4.3$2.50 8.7%
QWEN3.6-PLUS$1.95 31.6%
NEMOTRON-3-ULT$2.50 25.9%
QWEN3.7-PLUS$1.60 21.4%
MINIMAX-M1$2.20 11.9%
PALMYRA-X5$6.00 26.9%
QWEN3.7-MAX$3.75 3.1%
GEMINI-3.5-FLA$9.00 8.3%
GEMINI-2.5-PRO$10.00 7.2%
GPT-5.4-NANO$1.25 10.0%
NOVA-LITE-V1$0.24 28.9%
KIMI-K2.5$1.90 9.8%
MINISTRAL-14B-$0.20 17.7%

Olmo 3 32B Think 对比 Llama 3.3 70B Instruct

输入价格
$0.15
$0.10
输出价格
$0.50
$0.32
上下文窗口
66K
131K
吞吐
156 tok/s
149 tok/s
可用性
99.0%
100.0%
单任务成本
$0.001
$0.000
效率评分
89
89

按负载估算每月成本

指标
OLMO-3-32B-THI
LLAMA-3.3-70B-
聊天助手
$105.00
$68.40
RAG / 长上下文
$225.00
$148.80
智能体 / 工具调用
$288.00
$187.20

效率评分: Llama 3.3 70B Instruct

综合价格、速度与可靠性,Llama 3.3 70B Instruct 在多数负载下整体更均衡——但最终取舍取决于你输入、输出与延迟的具体配比。

数据为示意性演示数据,不构成投资建议。

常见问题

Olmo 3 32B Think 和 Llama 3.3 70B Instruct 哪个更便宜?+

Llama 3.3 70B Instruct 的输入价格更低——$0.10 vs $0.15/百万 Token——多数混合负载下它是两者中更划算的。数字为示意性演示数据。

Olmo 3 32B Think 和 Llama 3.3 70B Instruct 该选哪个?+

综合价格、速度与可靠性,Llama 3.3 70B Instruct 在多数负载下整体更均衡——但最终取舍取决于你输入、输出与延迟的具体配比。