实时

DEEPSEEK-V4-FL$0.20▼ 26.3%

DEEPSEEK-V4-PR$0.87▲ 4.6%

QWEN3.6-FLASH$1.13▼ 24.9%

NEMOTRON-3-SUP$0.45▼ 23.9%

LLAMA-4-MAVERI$0.60▼ 11.9%

LLAMA-4-SCOUT$0.30▲ 5.8%

GEMINI-3.1-FLA$1.50▼ 10.0%

GEMINI-2.5-FLA$0.40▼ 0.8%

MINIMAX-01$1.10▲ 8.0%

MIMO-V2.5$0.28▼ 5.8%

MIMO-V2.5-PRO$0.87▲ 2.6%

MINIMAX-M3$1.20▼ 6.1%

QWEN3.5-PLUS-2$1.80▼ 6.0%

NOVA-2-LITE-V1$2.50▼ 31.4%

GEMINI-2.5-FLA$2.50▼ 9.5%

GROK-4.3$2.50▼ 8.7%

QWEN3.6-PLUS$1.95▼ 31.6%

NEMOTRON-3-ULT$2.50▼ 25.9%

QWEN3.7-PLUS$1.60▼ 21.4%

MINIMAX-M1$2.20▲ 11.9%

PALMYRA-X5$6.00▼ 26.9%

QWEN3.7-MAX$3.75▼ 3.1%

GEMINI-3.5-FLA$9.00▼ 8.3%

GEMINI-2.5-PRO$10.00▲ 7.2%

GPT-5.4-NANO$1.25▲ 10.0%

NOVA-LITE-V1$0.24▼ 28.9%

KIMI-K2.5$1.90▲ 9.8%

MINISTRAL-14B-$0.20▼ 17.7%

DEEPSEEK-V4-FL$0.20▼ 26.3%

DEEPSEEK-V4-PR$0.87▲ 4.6%

QWEN3.6-FLASH$1.13▼ 24.9%

NEMOTRON-3-SUP$0.45▼ 23.9%

LLAMA-4-MAVERI$0.60▼ 11.9%

LLAMA-4-SCOUT$0.30▲ 5.8%

GEMINI-3.1-FLA$1.50▼ 10.0%

GEMINI-2.5-FLA$0.40▼ 0.8%

MINIMAX-01$1.10▲ 8.0%

MIMO-V2.5$0.28▼ 5.8%

MIMO-V2.5-PRO$0.87▲ 2.6%

MINIMAX-M3$1.20▼ 6.1%

QWEN3.5-PLUS-2$1.80▼ 6.0%

NOVA-2-LITE-V1$2.50▼ 31.4%

GEMINI-2.5-FLA$2.50▼ 9.5%

GROK-4.3$2.50▼ 8.7%

QWEN3.6-PLUS$1.95▼ 31.6%

NEMOTRON-3-ULT$2.50▼ 25.9%

QWEN3.7-PLUS$1.60▼ 21.4%

MINIMAX-M1$2.20▲ 11.9%

PALMYRA-X5$6.00▼ 26.9%

QWEN3.7-MAX$3.75▼ 3.1%

GEMINI-3.5-FLA$9.00▼ 8.3%

GEMINI-2.5-PRO$10.00▲ 7.2%

GPT-5.4-NANO$1.25▲ 10.0%

NOVA-LITE-V1$0.24▼ 28.9%

KIMI-K2.5$1.90▲ 9.8%

MINISTRAL-14B-$0.20▼ 17.7%

Olmo 3 32B Think 对比 Llama 3.3 70B Instruct

Llama 3.3 70B Instruct

Olmo 3 32B Think

Llama 3.3 70B Instruct

指标

Olmo 3 32B Think Llama 3.3 70B Instruct

输入价格

$0.15

$0.10

输出价格

$0.50

$0.32

上下文窗口

66K

131K

吞吐

156 tok/s

149 tok/s

可用性

99.0%

100.0%

单任务成本

$0.001

$0.000

效率评分

89

89

按负载估算每月成本

指标

OLMO-3-32B-THI

LLAMA-3.3-70B-

聊天助手

$105.00

$68.40

RAG / 长上下文

$225.00

$148.80

智能体 / 工具调用

$288.00

$187.20

效率评分: Llama 3.3 70B Instruct

综合价格、速度与可靠性,Llama 3.3 70B Instruct 在多数负载下整体更均衡——但最终取舍取决于你输入、输出与延迟的具体配比。

数据为示意性演示数据,不构成投资建议。

常见问题

Olmo 3 32B Think 和 Llama 3.3 70B Instruct 哪个更便宜?+

Llama 3.3 70B Instruct 的输入价格更低——$0.10 vs $0.15/百万 Token——多数混合负载下它是两者中更划算的。数字为示意性演示数据。

Olmo 3 32B Think 和 Llama 3.3 70B Instruct 该选哪个?+

综合价格、速度与可靠性,Llama 3.3 70B Instruct 在多数负载下整体更均衡——但最终取舍取决于你输入、输出与延迟的具体配比。