Elo de preferência humana real de votos cegos frente a frente de LMArena. Quanto maior, melhor; - significa ainda não classificado nessa arena. Isso é medido, não nossa estimativa.
Combinação de US$/1 milhão em versões rastreadas desta linha.
Mix típico de saída para entrada de 3:1, por 1 milhão de tokens
Preço em 2026-04-28 · Fonte: legacy_model_catalog
Cargas de trabalho mistas de texto, imagem, áudio e documentos que se beneficiam de um modelo em todas as modalidades.
Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across...
gemini-3.1-flash-lite-preview é um modelo Multimodal da Google (US). HotON.ai o rastreia em $0.25 por 1 milhão de tokens de entrada e $1.50 por 1 milhão de tokens de saída, com uma janela de contexto de token 1049K. Sua pontuação de eficiência composta é 96/100 com um $0.001 estimado por tarefa bem-sucedida.
gemini-3.1-flash-lite-preview é rastreado em $0.25 por 1 milhão de tokens de entrada e $1.50 por 1 milhão de tokens de saída. Uma carga de trabalho típica de saída para entrada de 3:1 combina aproximadamente $1.19 por 1 milhão de tokens. Os números são dados de demonstração ilustrativos.
Cargas de trabalho mistas de texto, imagem, áudio e documentos que se beneficiam de um modelo em todas as modalidades.
gemini-3.1-flash-lite-preview suporta até uma janela de contexto de token 1049K – grande o suficiente para documentos longos e conversas estendidas em uma única solicitação.
Dentro do conjunto rastreado HotON.ai, gemini-3.1-flash-lite-preview é mais barato que 58% dos modelos no preço de entrada e classifica #6 de 521 em termos de eficiência geral.
Sim – gpt-4.1-nano é uma opção de custo mais baixo em $0.40 por 1 milhão de tokens de saída, ao mesmo tempo que cobre casos de uso semelhantes de Multimodal. Compare-os lado a lado no HotON.ai.
O preço é real (através do catálogo TestKey, atualizado diariamente). A qualidade (Arena Elo) é real onde o modelo é classificado no LMArena. Velocidade, disponibilidade e eficiência são estimativas modeladas.