Дневная смешанная цена ($/1 миллион) — регистрируется каждый день и со временем превращается в тренд.
Типичное соотношение вывода и ввода 3:1 на 1 млн токенов
Цена по состоянию на 2026-04-28 · Источник: legacy_model_catalog
Сложные рассуждения, анализ, планирование и многоэтапное решение проблем, где качество ответа важнее, чем чистая стоимость.
DeepSeek R1 Distill Llama 70B is a distilled large language model based on Llama-3.3-70B-Instruct, using outputs from DeepSeek R1. The model combines advanced distillation techniques to achieve high performance across...
deepseek-r1-distill-llama-70b — это модель Рассуждение от DeepSeek (CN). HotON.ai отслеживает его на уровне $0.70 на 1 миллион входных токенов и $0.80 на 1 миллион выходных токенов с помощью контекстного окна токена 131K. Его совокупный показатель эффективности составляет 89/100 при расчетном $0.002 на каждую успешную задачу.
deepseek-r1-distill-llama-70b отслеживается по формуле $0.70 на 1 миллион входных токенов и $0.80 на 1 миллион выходных токенов. Типичная рабочая нагрузка вывода-ввода 3:1 составляет примерно $0.78 на 1 млн токенов. Цифры являются иллюстративными демонстрационными данными.
Сложные рассуждения, анализ, планирование и многоэтапное решение проблем, где качество ответа важнее, чем чистая стоимость.
deepseek-r1-distill-llama-70b поддерживает контекстное окно токена 131K — достаточно большое для длинных документов и расширенных разговоров в одном запросе.
В гусеничном наборе HotON.ai модель deepseek-r1-distill-llama-70b дешевле моделей 37% по входной цене и занимает место #115 среди 521 по общей эффективности.
Да, qwen-plus-2025-07-28:thinking — это более дешевый вариант $0.78 за 1 миллион выходных токенов, но при этом охватывающий аналогичные сценарии использования Рассуждение. Сравните их на HotON.ai.
Цены реальные (через каталог TestKey, обновляемый ежедневно). Качество (Арена Эло) является реальным там, где модель находится в рейтинге LMArena. Скорость, доступность и эффективность являются смоделированными оценками.