trinity-large-preview 对比 @cf/meta/llama-3.1-8b-instruct
价格更低
@cf/meta/llama-3.1-8b-instruct
更快
@cf/meta/llama-3.1-8b-instruct
效率更高
@cf/meta/llama-3.1-8b-instruct
输入价格
$0.15
$0.00
输出价格
$0.45
$0.00
上下文窗口
131K
128K
吞吐
125 tok/s
171 tok/s
可用性
98.7%
99.5%
单任务成本
$0.001
$0.000
效率评分
89
89
按负载估算每月成本
指标
TRINITY-LARGE-
-CF
聊天助手
$99.00
$0.00
RAG / 长上下文
$220.50
$0.00
智能体 / 工具调用
$270.00
$0.00
效率评分: @cf/meta/llama-3.1-8b-instruct
综合价格、速度与可靠性,@cf/meta/llama-3.1-8b-instruct 在多数负载下整体更均衡——但最终取舍取决于你输入、输出与延迟的具体配比。
数据为示意性演示数据,不构成投资建议。
常见问题
trinity-large-preview 和 @cf/meta/llama-3.1-8b-instruct 哪个更便宜?+
@cf/meta/llama-3.1-8b-instruct 的输入价格更低——$0.00 vs $0.15/百万 Token——多数混合负载下它是两者中更划算的。数字为示意性演示数据。
trinity-large-preview 和 @cf/meta/llama-3.1-8b-instruct 该选哪个?+
综合价格、速度与可靠性,@cf/meta/llama-3.1-8b-instruct 在多数负载下整体更均衡——但最终取舍取决于你输入、输出与延迟的具体配比。