US多模态GOOGLE 实时 · 每日更新

google/gemini-3.1-flash-lite

Portkey AI Gateway

效率评分

96/100

−7.3%

输入价格

$0.25/ 百万 Token

输出价格

$1.50/ 百万 Token

上下文窗口

1049K

吞吐

133tok/s

可用性

99.6%

单任务成本

$0.001

能力

可接受输入

图像

可生成输出

文本

7 日热度走势

−7.3%

价格拆解

输入价格

$0.25/ 百万 Token

$0.0003 / 千

输出价格

$1.50/ 百万 Token

$0.0015 / 千

混合价格

$1.19/ 百万 Token

$0.0012 / 千

典型 3:1 输出/输入比,每百万 Token

按负载估算每月成本

聊天助手

$255.00/ 月

输入1K · 输出400 · 1万次/天

RAG / 长上下文

$435.00/ 月

输入8K · 输出600 · 5千次/天

智能体 / 工具调用

$720.00/ 月

输入3K · 输出1.5K · 8千次/天

估算你的成本 →

市场定位

比 26% 的收录模型更便宜
比 23% 的收录模型更快
效率排名: #29 共 1105

最适合的场景

文本、图像、音频与文档混合负载,适合用一个模型覆盖多模态。

关于 google/gemini-3.1-flash-lite

Google Gemini 3.1 Flash Lite via Portkey 是 Portkey AI Gateway 的多模态模型，面向视觉理解和文本生成，上下文上限约 1,048,576 tokens。

google/gemini-3.1-flash-lite 是 Portkey AI Gateway(US)推出的多模态模型。HotON.ai 记录其输入价格为每百万 Token $0.25 美元、输出每百万 Token $1.50 美元,上下文窗口 1049K Token,吞吐约 133 tokens/秒,可用性 99.6%。其综合效率评分为 96/100,单次成功任务成本约 $0.001 美元。

对比 google/gemini-3.1-flash-lite

GOOGLE vs GEMINI-2.0-FLA GOOGLE vs GEMINI-2.0-FLA GOOGLE vs -CF GOOGLE vs LLAMA-4-MAVERI

常见问题

google/gemini-3.1-flash-lite 每百万 Token 多少钱?+

google/gemini-3.1-flash-lite 的收录价格为输入 $0.25/百万 Token、输出 $1.50/百万 Token。按典型 3:1 输出/输入比,混合约 $1.19/百万 Token。数字为示意性演示数据。

google/gemini-3.1-flash-lite 最适合做什么?+

文本、图像、音频与文档混合负载,适合用一个模型覆盖多模态。

google/gemini-3.1-flash-lite 的速度如何?+

google/gemini-3.1-flash-lite 约 133 tokens/秒,收录可用性 99.6%,适合对延迟敏感的实时应用。

google/gemini-3.1-flash-lite 比其他模型便宜吗?+

在 HotON.ai 收录范围内,google/gemini-3.1-flash-lite 的输入价格比 26% 的模型更便宜,综合效率排名第 29(共 1105)。