效率评分
96/100
−7.3%输入价格
$0.25/ 百万 Token
输出价格
$1.50/ 百万 Token
上下文窗口
1049K
吞吐
133tok/s
可用性
99.6%
单任务成本
$0.001
能力
可接受输入
图像
可生成输出
文本
7 日热度走势
−7.3%价格拆解
输入价格
$0.25/ 百万 Token
$0.0003 / 千
输出价格
$1.50/ 百万 Token
$0.0015 / 千
混合价格
$1.19/ 百万 Token
$0.0012 / 千
典型 3:1 输出/输入比,每百万 Token
按负载估算每月成本
聊天助手
$255.00/ 月
输入1K · 输出400 · 1万次/天
RAG / 长上下文
$435.00/ 月
输入8K · 输出600 · 5千次/天
智能体 / 工具调用
$720.00/ 月
输入3K · 输出1.5K · 8千次/天
市场定位
- 比 26% 的收录模型更便宜
- 比 23% 的收录模型更快
- 效率排名: #29 共 1105
最适合的场景
文本、图像、音频与文档混合负载,适合用一个模型覆盖多模态。
关于 google/gemini-3.1-flash-lite
Google Gemini 3.1 Flash Lite via Portkey 是 Portkey AI Gateway 的多模态模型,面向视觉理解和文本生成,上下文上限约 1,048,576 tokens。
google/gemini-3.1-flash-lite 是 Portkey AI Gateway(US)推出的 多模态 模型。HotON.ai 记录其输入价格为每百万 Token $0.25 美元、输出每百万 Token $1.50 美元,上下文窗口 1049K Token,吞吐约 133 tokens/秒,可用性 99.6%。其综合效率评分为 96/100,单次成功任务成本约 $0.001 美元。
对比 google/gemini-3.1-flash-lite
相关市场资讯
常见问题
google/gemini-3.1-flash-lite 每百万 Token 多少钱?+
google/gemini-3.1-flash-lite 的收录价格为输入 $0.25/百万 Token、输出 $1.50/百万 Token。按典型 3:1 输出/输入比,混合约 $1.19/百万 Token。数字为示意性演示数据。
google/gemini-3.1-flash-lite 最适合做什么?+
文本、图像、音频与文档混合负载,适合用一个模型覆盖多模态。
google/gemini-3.1-flash-lite 的速度如何?+
google/gemini-3.1-flash-lite 约 133 tokens/秒,收录可用性 99.6%,适合对延迟敏感的实时应用。
google/gemini-3.1-flash-lite 比其他模型便宜吗?+
在 HotON.ai 收录范围内,google/gemini-3.1-flash-lite 的输入价格比 26% 的模型更便宜,综合效率排名第 29(共 1105)。
相关模型
价格为真实数据(来自 TestKey 目录,每日更新)。质量(竞技场 Elo)在模型已上 LMArena 榜时为真实数据。速度、可用性与效率为模型估算。