Preço combinado diário (US$/1 milhão) — registrado todos os dias, cria uma tendência ao longo do tempo.
Mix típico de saída para entrada de 3:1, por 1 milhão de tokens
Preço em 2026-04-28 · Fonte: legacy_model_catalog
Raciocínio complexo, análise, planejamento e resolução de problemas em várias etapas, onde a qualidade da resposta é mais importante do que o custo bruto.
DeepSeek R1 Distill Llama 70B is a distilled large language model based on Llama-3.3-70B-Instruct, using outputs from DeepSeek R1. The model combines advanced distillation techniques to achieve high performance across...
deepseek-r1-distill-llama-70b é um modelo Raciocínio da DeepSeek (CN). HotON.ai o rastreia em $0.70 por 1 milhão de tokens de entrada e $0.80 por 1 milhão de tokens de saída, com uma janela de contexto de token 131K. Sua pontuação de eficiência composta é 89/100 com um $0.002 estimado por tarefa bem-sucedida.
deepseek-r1-distill-llama-70b é rastreado em $0.70 por 1 milhão de tokens de entrada e $0.80 por 1 milhão de tokens de saída. Uma carga de trabalho típica de saída para entrada de 3:1 combina aproximadamente $0.78 por 1 milhão de tokens. Os números são dados de demonstração ilustrativos.
Raciocínio complexo, análise, planejamento e resolução de problemas em várias etapas, onde a qualidade da resposta é mais importante do que o custo bruto.
deepseek-r1-distill-llama-70b suporta até uma janela de contexto de token 131K – grande o suficiente para documentos longos e conversas estendidas em uma única solicitação.
Dentro do conjunto rastreado HotON.ai, deepseek-r1-distill-llama-70b é mais barato que 37% dos modelos no preço de entrada e classifica #115 de 521 em termos de eficiência geral.
Sim – qwen-plus-2025-07-28:thinking é uma opção de custo mais baixo em $0.78 por 1 milhão de tokens de saída, ao mesmo tempo que cobre casos de uso semelhantes de Raciocínio. Compare-os lado a lado no HotON.ai.
O preço é real (através do catálogo TestKey, atualizado diariamente). A qualidade (Arena Elo) é real onde o modelo é classificado no LMArena. Velocidade, disponibilidade e eficiência são estimativas modeladas.