Precio combinado diario ($/1 millón): registrado cada día, genera una tendencia con el tiempo.
Mezcla típica de salida a entrada 3:1, por 1 millón de tokens
Precio a partir de 2026-04-28 · Fuente: legacy_model_catalog
Razonamiento complejo, análisis, planificación y resolución de problemas de varios pasos donde la calidad de la respuesta importa más que el costo bruto.
DeepSeek R1 Distill Llama 70B is a distilled large language model based on Llama-3.3-70B-Instruct, using outputs from DeepSeek R1. The model combines advanced distillation techniques to achieve high performance across...
deepseek-r1-distill-llama-70b es un modelo Razonamiento de DeepSeek (CN). HotON.ai lo rastrea en $0.70 por 1 millón de tokens de entrada y $0.80 por 1 millón de tokens de salida, con una ventana contextual de token 131K. Su puntuación de eficiencia compuesta es 89/100 con un $0.002 estimado por tarea exitosa.
deepseek-r1-distill-llama-70b se rastrea en $0.70 por 1 millón de tokens de entrada y $0.80 por 1 millón de tokens de salida. Una carga de trabajo típica de salida a entrada de 3:1 se combina aproximadamente con $0.78 por 1 millón de tokens. Las cifras son datos de demostración ilustrativos.
Razonamiento complejo, análisis, planificación y resolución de problemas de varios pasos donde la calidad de la respuesta importa más que el costo bruto.
deepseek-r1-distill-llama-70b admite hasta una ventana contextual de token 131K, lo suficientemente grande para documentos largos y conversaciones extensas en una sola solicitud.
Dentro del conjunto de seguimiento HotON.ai, deepseek-r1-distill-llama-70b es más barato que el % 37 de los modelos en cuanto al precio de entrada y ocupa el puesto #115 de 521 por eficiencia general.
Sí, qwen-plus-2025-07-28:thinking es una opción de menor costo en $0.78 por 1 millón de tokens de salida, y al mismo tiempo cubre casos de uso similares de Razonamiento. Compárelos uno al lado del otro en HotON.ai.
El precio es real (a través del catálogo TestKey, actualizado diariamente). La calidad (Arena Elo) es real donde el modelo se clasifica en LMArena. La velocidad, la disponibilidad y la eficiencia son estimaciones modeladas.