实时
BODYBUILDER$-1000000.00 5.4%
GLM-4-LONG$0.00 14.1%
GEMINI-2.0-FLA$0.30 20.0%
GEMINI-2.0-FLA$0.40 6.6%
-CF$0.00 9.7%
DEEPSEEK-V4-FL$0.28 26.3%
LLAMA-4-MAVERI$0.60 11.9%
GROK-4-FAST$0.50 6.0%
QWEN-PLUS$0.78 0.6%
MINIMAX-M2.1$0.95 2.6%
MINIMAX-M2$1.00 2.9%
MINIMAX-01$1.10 8.0%
GPT-4.1-MINI$1.60 13.7%
GROK-4-1-FAST-$0.50 8.9%
GPT-4.1-MINI-2$1.60 31.8%
XAI$0.00 4.5%
MINIMAX-M2.7$0.00 9.9%
QWEN3.5-FLASH-$0.26 31.0%
GPT-4.1-NANO$0.40 13.0%
GEMINI-2.5-FLA$0.40 0.8%
DEEPSEEK-AI$0.00 27.0%
GROK-4.1-FAST$0.50 16.4%
MINIMAX-M3$1.20 6.1%
GOOGLE$1.50 3.4%
AUTO$0.00 9.7%
GOOGLE$0.00 27.8%
MINIMAX-M2.7$1.20 7.2%
GOOGLE$0.00 0.6%
BODYBUILDER$-1000000.00 5.4%
GLM-4-LONG$0.00 14.1%
GEMINI-2.0-FLA$0.30 20.0%
GEMINI-2.0-FLA$0.40 6.6%
-CF$0.00 9.7%
DEEPSEEK-V4-FL$0.28 26.3%
LLAMA-4-MAVERI$0.60 11.9%
GROK-4-FAST$0.50 6.0%
QWEN-PLUS$0.78 0.6%
MINIMAX-M2.1$0.95 2.6%
MINIMAX-M2$1.00 2.9%
MINIMAX-01$1.10 8.0%
GPT-4.1-MINI$1.60 13.7%
GROK-4-1-FAST-$0.50 8.9%
GPT-4.1-MINI-2$1.60 31.8%
XAI$0.00 4.5%
MINIMAX-M2.7$0.00 9.9%
QWEN3.5-FLASH-$0.26 31.0%
GPT-4.1-NANO$0.40 13.0%
GEMINI-2.5-FLA$0.40 0.8%
DEEPSEEK-AI$0.00 27.0%
GROK-4.1-FAST$0.50 16.4%
MINIMAX-M3$1.20 6.1%
GOOGLE$1.50 3.4%
AUTO$0.00 9.7%
GOOGLE$0.00 27.8%
MINIMAX-M2.7$1.20 7.2%
GOOGLE$0.00 0.6%

phi-4-mini-instruct 对比 14B-Qwen2.5-Kunou-v1

输入价格
$0.08
$0.00
输出价格
$0.35
$0.00
上下文窗口
128K
33K
吞吐
119 tok/s
141 tok/s
可用性
100.0%
98.0%
单任务成本
$0.000
$0.000
效率评分
89
89

按负载估算每月成本

指标
PHI-4-MINI-INS
14B-QWEN2.5-KU
聊天助手
$66.00
$0.00
RAG / 长上下文
$127.50
$0.00
智能体 / 工具调用
$183.60
$0.00

效率评分: phi-4-mini-instruct

综合价格、速度与可靠性,phi-4-mini-instruct 在多数负载下整体更均衡——但最终取舍取决于你输入、输出与延迟的具体配比。

数据为示意性演示数据,不构成投资建议。

常见问题

phi-4-mini-instruct 和 14B-Qwen2.5-Kunou-v1 哪个更便宜?+

14B-Qwen2.5-Kunou-v1 的输入价格更低——$0.00 vs $0.08/百万 Token——多数混合负载下它是两者中更划算的。数字为示意性演示数据。

phi-4-mini-instruct 和 14B-Qwen2.5-Kunou-v1 该选哪个?+

综合价格、速度与可靠性,phi-4-mini-instruct 在多数负载下整体更均衡——但最终取舍取决于你输入、输出与延迟的具体配比。