Preço combinado diário (US$/1 milhão) — registrado todos os dias, cria uma tendência ao longo do tempo.
Mix típico de saída para entrada de 3:1, por 1 milhão de tokens
Preço em 2026-05-11 · Fonte: meta_reference_catalog
Cargas de trabalho mistas de texto, imagem, áudio e documentos que se beneficiam de um modelo em todas as modalidades.
Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B. It supports native multimodal input...
llama-4-scout é um modelo Multimodal da Meta (US). HotON.ai o rastreia em $0.08 por 1 milhão de tokens de entrada e $0.30 por 1 milhão de tokens de saída, com uma janela de contexto de token 328K. Sua pontuação de eficiência composta é 91/100 com um $0.000 estimado por tarefa bem-sucedida.
llama-4-scout é rastreado em $0.08 por 1 milhão de tokens de entrada e $0.30 por 1 milhão de tokens de saída. Uma carga de trabalho típica de saída para entrada de 3:1 combina aproximadamente $0.24 por 1 milhão de tokens. Os números são dados de demonstração ilustrativos.
Cargas de trabalho mistas de texto, imagem, áudio e documentos que se beneficiam de um modelo em todas as modalidades.
llama-4-scout suporta até uma janela de contexto de token 328K – grande o suficiente para documentos longos e conversas estendidas em uma única solicitação.
Dentro do conjunto rastreado HotON.ai, llama-4-scout é mais barato que 85% dos modelos no preço de entrada e classifica #62 de 521 em termos de eficiência geral.
Sim – qwen3.5-flash-02-23 é uma opção de custo mais baixo em $0.26 por 1 milhão de tokens de saída, ao mesmo tempo que cobre casos de uso semelhantes de Multimodal. Compare-os lado a lado no HotON.ai.
O preço é real (através do catálogo TestKey, atualizado diariamente). A qualidade (Arena Elo) é real onde o modelo é classificado no LMArena. Velocidade, disponibilidade e eficiência são estimativas modeladas.