能力
7 日热度走势
−27.4%价格拆解
典型 3:1 输出/输入比,每百万 Token
按负载估算每月成本
市场定位
- 比 43% 的收录模型更便宜
- 比 30% 的收录模型更快
- 效率排名: #269 共 1105
最适合的场景
通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。
关于 @cf/meta/llama-3.3-70b-instruct-fp8-fast
Meta Llama 3.3 70B Instruct FP8 Fast on Workers AI 是 Cloudflare Workers AI 的文本大模型,面向文本生成和对话,上下文上限约 128,000 tokens。
@cf/meta/llama-3.3-70b-instruct-fp8-fast 是 Cloudflare Workers AI(US)推出的 文本 模型。HotON.ai 记录其输入价格为每百万 Token $0.00 美元、输出每百万 Token $0.00 美元,上下文窗口 128K Token,吞吐约 138 tokens/秒,可用性 97.9%。其综合效率评分为 89/100,单次成功任务成本约 $0.000 美元。
对比 @cf/meta/llama-3.3-70b-instruct-fp8-fast
相关市场资讯
常见问题
@cf/meta/llama-3.3-70b-instruct-fp8-fast 每百万 Token 多少钱?+
@cf/meta/llama-3.3-70b-instruct-fp8-fast 的收录价格为输入 $0.00/百万 Token、输出 $0.00/百万 Token。按典型 3:1 输出/输入比,混合约 $0.00/百万 Token。数字为示意性演示数据。
@cf/meta/llama-3.3-70b-instruct-fp8-fast 最适合做什么?+
通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。
@cf/meta/llama-3.3-70b-instruct-fp8-fast 的速度如何?+
@cf/meta/llama-3.3-70b-instruct-fp8-fast 约 138 tokens/秒,收录可用性 97.9%,适合对延迟敏感的实时应用。
@cf/meta/llama-3.3-70b-instruct-fp8-fast 比其他模型便宜吗?+
在 HotON.ai 收录范围内,@cf/meta/llama-3.3-70b-instruct-fp8-fast 的输入价格比 43% 的模型更便宜,综合效率排名第 269(共 1105)。
相关模型
价格为真实数据(来自 TestKey 目录,每日更新)。质量(竞技场 Elo)在模型已上 LMArena 榜时为真实数据。速度、可用性与效率为模型估算。