USTextoLLAMA-3.1-8B-I Ao vivo · atualizado diariamente

llama-3.1-8b-instant

Groq

Pontuação de eficiência

89/100

Preço de entrada

$0.05/ 1 milhão de tokens

Preço de saída

$0.08/ 1 milhão de tokens

Janela de contexto

131K

Preço combinado

$0.07/ 1 milhão de tokens

Custo/tarefa

$0.000

Capacidades

Aceita (entrada)

Texto

Produz (saída)

Texto

Preço ao longo do tempo

Preço combinado diário (US$/1 milhão) — registrado todos os dias, cria uma tendência ao longo do tempo.

Análise de preços

Preço de entrada

$0.05/ 1 milhão de tokens

$0.0001 /1K

Preço de saída

$0.08/ 1 milhão de tokens

$0.0001 /1K

Preço combinado

$0.07/ 1 milhão de tokens

$0.0001 /1K

Mix típico de saída para entrada de 3:1, por 1 milhão de tokens

Preço em 2026-05-10 · Fonte: groq_official_pricing

Custo mensal estimado por carga de trabalho

Assistente de bate-papo

$24.60/ mês

1K de entrada · 400 de saída · 10K de necessidade/dia

RAG/contexto longo

$67.20/ mês

8K de entrada · 600 de saída · 5K de necessidade/dia

Uso de agente/ferramenta

$64.80/ mês

Entrada de 3K · Saída de 1,5K · Solicitação de 8K/dia

Estime seu custo →

Posição de mercado

Mais barato que 91% dos modelos rastreados
Contexto maior que 40% dos modelos rastreados
Classificação de eficiência: #183 de 522

Mais adequado para

Geração de texto de uso geral, bate-papo, resumo e cargas de trabalho de conteúdo onde ampla capacidade e baixo custo são mais importantes.

Sobre llama-3.1-8b-instant

Llama 3.1 8B hospedado pela Groq, otimizado para geração de texto de baixa latência e alto rendimento.

llama-3.1-8b-instant é um modelo Texto da Groq (US). HotON.ai o rastreia em $0.05 por 1 milhão de tokens de entrada e $0.08 por 1 milhão de tokens de saída, com uma janela de contexto de token 131K. Sua pontuação de eficiência composta é 89/100 com um $0.000 estimado por tarefa bem-sucedida.

Comparar llama-3.1-8b-instant

LLAMA-3.1-8B-I vs TRINITY-MINI LLAMA-3.1-8B-I vs HERMES-3-LLAMA LLAMA-3.1-8B-I vs MERCURY-2-STRU LLAMA-3.1-8B-I vs MINIMAX-M2.7-H

Notícias de mercado relacionadas

Barret Zoph sai da OpenAI novamente após apenas cinco meseshá 5 horas Tutorial de Salesforce CodeGen: Gerar, Validar e Reordenar Funções Python com Testes Unitários e Verificações de Segurançahá 7 horas Fonte: Elastic concorda em comprar DeductiveAI, apoiada pela CRV, por até $85Mhá 9 horas

Perguntas frequentes

Quanto custa llama-3.1-8b-instant por 1 milhão de tokens?+

llama-3.1-8b-instant é rastreado em $0.05 por 1 milhão de tokens de entrada e $0.08 por 1 milhão de tokens de saída. Uma carga de trabalho típica de saída para entrada de 3:1 combina aproximadamente $0.07 por 1 milhão de tokens. Os números são dados de demonstração ilustrativos.

Qual é o melhor llama-3.1-8b-instant?+

Geração de texto de uso geral, bate-papo, resumo e cargas de trabalho de conteúdo onde ampla capacidade e baixo custo são mais importantes.

Qual é o tamanho da janela de contexto do llama-3.1-8b-instant?+

llama-3.1-8b-instant suporta até uma janela de contexto de token 131K – grande o suficiente para documentos longos e conversas estendidas em uma única solicitação.

O llama-3.1-8b-instant é mais barato que outros modelos de IA?+

Dentro do conjunto rastreado HotON.ai, llama-3.1-8b-instant é mais barato que 91% dos modelos no preço de entrada e classifica #183 de 522 em termos de eficiência geral.

Existe uma alternativa mais barata ao llama-3.1-8b-instant?+

Sim – Llama-3.2-3B-Instruct é uma opção de custo mais baixo em $0.02 por 1 milhão de tokens de saída, ao mesmo tempo que cobre casos de uso semelhantes de Texto. Compare-os lado a lado no HotON.ai.

Cite este modelo

Pronto para colar em artigos, documentos ou avisos de IA — preços e datas atualizados com os dados em tempo real.

HotON.ai — llama-3.1-8b-instant (Groq): $0.05/1M input, $0.08/1M output, as of 2026-05-10. https://hoton.ai/pt/models/groq-llama-3-1-8b-instant

Modelos relacionados

trinity-mini

Arcee Ai

$0.15

hermes-3-llama-3.1-70b

Nousresearch

$0.30

mercury-2-structured-outputs

Inception

$0.75

minimax-m2.7-highspeed

MiniMax

$1.20

O preço é real (através do catálogo TestKey, atualizado diariamente). A qualidade (Arena Elo) é real onde o modelo é classificado no LMArena. Velocidade, disponibilidade e eficiência são estimativas modeladas.

Análise de preços

Preço de entrada

$0.05/ 1 milhão de tokens

$0.0001 /1K

Preço de saída

$0.08/ 1 milhão de tokens

$0.0001 /1K

Preço combinado

$0.07/ 1 milhão de tokens

$0.0001 /1K

Mix típico de saída para entrada de 3:1, por 1 milhão de tokens

Custo mensal estimado por carga de trabalho

Assistente de bate-papo

$24.60/ mês

1K de entrada · 400 de saída · 10K de necessidade/dia

RAG/contexto longo

$67.20/ mês

8K de entrada · 600 de saída · 5K de necessidade/dia

Uso de agente/ferramenta

$64.80/ mês

Entrada de 3K · Saída de 1,5K · Solicitação de 8K/dia

Estime seu custo →

Mais adequado para

Geração de texto de uso geral, bate-papo, resumo e cargas de trabalho de conteúdo onde ampla capacidade e baixo custo são mais importantes.

Sobre llama-3.1-8b-instant

Llama 3.1 8B hospedado pela Groq, otimizado para geração de texto de baixa latência e alto rendimento.

Perguntas frequentes

Quanto custa llama-3.1-8b-instant por 1 milhão de tokens?+

Qual é o melhor llama-3.1-8b-instant?+

Geração de texto de uso geral, bate-papo, resumo e cargas de trabalho de conteúdo onde ampla capacidade e baixo custo são mais importantes.

Qual é o tamanho da janela de contexto do llama-3.1-8b-instant?+

llama-3.1-8b-instant suporta até uma janela de contexto de token 131K – grande o suficiente para documentos longos e conversas estendidas em uma única solicitação.

O llama-3.1-8b-instant é mais barato que outros modelos de IA?+

Dentro do conjunto rastreado HotON.ai, llama-3.1-8b-instant é mais barato que 91% dos modelos no preço de entrada e classifica #183 de 522 em termos de eficiência geral.

Existe uma alternativa mais barata ao llama-3.1-8b-instant?+