Combinação de US$/1 milhão em versões rastreadas desta linha.
Mix típico de saída para entrada de 3:1, por 1 milhão de tokens
Preço em 2026-05-11 · Fonte: meta_reference_catalog
Geração de texto de uso geral, bate-papo, resumo e cargas de trabalho de conteúdo onde ampla capacidade e baixo custo são mais importantes.
Meta's latest class of model (Llama 3) launched with a variety of sizes & flavors. This 8B instruct-tuned version was optimized for high quality dialogue usecases. It has demonstrated strong...
llama-3-8b-instruct é um modelo Texto da Meta (US). HotON.ai o rastreia em $0.03 por 1 milhão de tokens de entrada e $0.04 por 1 milhão de tokens de saída, com uma janela de contexto de token 8K. Sua pontuação de eficiência composta é 88/100 com um $0.000 estimado por tarefa bem-sucedida.
llama-3-8b-instruct é rastreado em $0.03 por 1 milhão de tokens de entrada e $0.04 por 1 milhão de tokens de saída. Uma carga de trabalho típica de saída para entrada de 3:1 combina aproximadamente $0.04 por 1 milhão de tokens. Os números são dados de demonstração ilustrativos.
Geração de texto de uso geral, bate-papo, resumo e cargas de trabalho de conteúdo onde ampla capacidade e baixo custo são mais importantes.
llama-3-8b-instruct suporta até uma janela de contexto de token 8K – grande o suficiente para documentos longos e conversas estendidas em uma única solicitação.
Dentro do conjunto rastreado HotON.ai, llama-3-8b-instruct é mais barato que 95% dos modelos no preço de entrada e classifica #299 de 521 em termos de eficiência geral.
Sim – gemma-3n-e4b-it é uma opção de custo mais baixo em $0.04 por 1 milhão de tokens de saída, ao mesmo tempo que cobre casos de uso semelhantes de Texto. Compare-os lado a lado no HotON.ai.
O preço é real (através do catálogo TestKey, atualizado diariamente). A qualidade (Arena Elo) é real onde o modelo é classificado no LMArena. Velocidade, disponibilidade e eficiência são estimativas modeladas.