Preço combinado diário (US$/1 milhão) — registrado todos os dias, cria uma tendência ao longo do tempo.
Mix típico de saída para entrada de 3:1, por 1 milhão de tokens
Preço em 2026-05-10 · Fonte: groq_official_pricing
Geração de texto de uso geral, bate-papo, resumo e cargas de trabalho de conteúdo onde ampla capacidade e baixo custo são mais importantes.
Llama 3.1 8B hospedado pela Groq, otimizado para geração de texto de baixa latência e alto rendimento.
llama-3.1-8b-instant é um modelo Texto da Groq (US). HotON.ai o rastreia em $0.05 por 1 milhão de tokens de entrada e $0.08 por 1 milhão de tokens de saída, com uma janela de contexto de token 131K. Sua pontuação de eficiência composta é 89/100 com um $0.000 estimado por tarefa bem-sucedida.
llama-3.1-8b-instant é rastreado em $0.05 por 1 milhão de tokens de entrada e $0.08 por 1 milhão de tokens de saída. Uma carga de trabalho típica de saída para entrada de 3:1 combina aproximadamente $0.07 por 1 milhão de tokens. Os números são dados de demonstração ilustrativos.
Geração de texto de uso geral, bate-papo, resumo e cargas de trabalho de conteúdo onde ampla capacidade e baixo custo são mais importantes.
llama-3.1-8b-instant suporta até uma janela de contexto de token 131K – grande o suficiente para documentos longos e conversas estendidas em uma única solicitação.
Dentro do conjunto rastreado HotON.ai, llama-3.1-8b-instant é mais barato que 91% dos modelos no preço de entrada e classifica #183 de 522 em termos de eficiência geral.
Sim – Llama-3.2-3B-Instruct é uma opção de custo mais baixo em $0.02 por 1 milhão de tokens de saída, ao mesmo tempo que cobre casos de uso semelhantes de Texto. Compare-os lado a lado no HotON.ai.
Pronto para colar em artigos, documentos ou avisos de IA — preços e datas atualizados com os dados em tempo real.
HotON.ai — llama-3.1-8b-instant (Groq): $0.05/1M input, $0.08/1M output, as of 2026-05-10. https://hoton.ai/pt/models/groq-llama-3-1-8b-instantO preço é real (através do catálogo TestKey, atualizado diariamente). A qualidade (Arena Elo) é real onde o modelo é classificado no LMArena. Velocidade, disponibilidade e eficiência são estimativas modeladas.