US文本-CF 实时 · 每日更新

@cf/meta/llama-3.3-70b-instruct-fp8-fast

Cloudflare Workers AI

效率评分

89/100

−27.4%

输入价格

$0.00/ 百万 Token

输出价格

$0.00/ 百万 Token

上下文窗口

128K

吞吐

138tok/s

可用性

97.9%

单任务成本

$0.000

能力

可接受输入

文本

可生成输出

文本

7 日热度走势

−27.4%

价格拆解

输入价格

$0.00/ 百万 Token

$0.0000 / 千

输出价格

$0.00/ 百万 Token

$0.0000 / 千

混合价格

$0.00/ 百万 Token

$0.0000 / 千

典型 3:1 输出/输入比,每百万 Token

按负载估算每月成本

聊天助手

$0.00/ 月

输入1K · 输出400 · 1万次/天

RAG / 长上下文

$0.00/ 月

输入8K · 输出600 · 5千次/天

智能体 / 工具调用

$0.00/ 月

输入3K · 输出1.5K · 8千次/天

估算你的成本 →

市场定位

比 43% 的收录模型更便宜
比 30% 的收录模型更快
效率排名: #269 共 1105

最适合的场景

通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。

关于 @cf/meta/llama-3.3-70b-instruct-fp8-fast

Meta Llama 3.3 70B Instruct FP8 Fast on Workers AI 是 Cloudflare Workers AI 的文本大模型，面向文本生成和对话，上下文上限约 128,000 tokens。

@cf/meta/llama-3.3-70b-instruct-fp8-fast 是 Cloudflare Workers AI(US)推出的文本模型。HotON.ai 记录其输入价格为每百万 Token $0.00 美元、输出每百万 Token $0.00 美元,上下文窗口 128K Token,吞吐约 138 tokens/秒,可用性 97.9%。其综合效率评分为 89/100,单次成功任务成本约 $0.000 美元。

对比 @cf/meta/llama-3.3-70b-instruct-fp8-fast

-CF vs -CF -CF vs GRANITE-4.1-8B -CF vs GRANITE-4.0-H--CF vs PHI-4-MINI-INS

常见问题

@cf/meta/llama-3.3-70b-instruct-fp8-fast 每百万 Token 多少钱?+

@cf/meta/llama-3.3-70b-instruct-fp8-fast 的收录价格为输入 $0.00/百万 Token、输出 $0.00/百万 Token。按典型 3:1 输出/输入比,混合约 $0.00/百万 Token。数字为示意性演示数据。

@cf/meta/llama-3.3-70b-instruct-fp8-fast 最适合做什么?+

通用文本生成、对话、摘要与内容类负载,最看重广泛能力与低成本。

@cf/meta/llama-3.3-70b-instruct-fp8-fast 的速度如何?+

@cf/meta/llama-3.3-70b-instruct-fp8-fast 约 138 tokens/秒,收录可用性 97.9%,适合对延迟敏感的实时应用。

@cf/meta/llama-3.3-70b-instruct-fp8-fast 比其他模型便宜吗?+

在 HotON.ai 收录范围内,@cf/meta/llama-3.3-70b-instruct-fp8-fast 的输入价格比 43% 的模型更便宜,综合效率排名第 269(共 1105)。

@cf/meta/llama-3.3-70b-instruct-fp8-fast

能力

7 日热度走势

价格拆解

按负载估算每月成本

市场定位

最适合的场景

关于 @cf/meta/llama-3.3-70b-instruct-fp8-fast

对比 @cf/meta/llama-3.3-70b-instruct-fp8-fast

相关市场资讯

常见问题

相关模型