Дневная смешанная цена ($/1 миллион) — регистрируется каждый день и со временем превращается в тренд.
Типичное соотношение вывода и ввода 3:1 на 1 млн токенов
Цена по состоянию на 2026-05-11 · Источник: nvidia_reference_catalog
Генерация текста общего назначения, чат, обобщение и работа с контентом, где широкие возможности и низкая стоимость имеют наибольшее значение.
NVIDIA Llama 3.1 Nemotron 70B — это языковая модель, предназначенная для генерации точных и полезных ответов. Используя архитектуру Llama 3.1 70B и технологию обучения с подкреплением на основе обратной связи с человеком (RLHF), она превосходит...
llama-3.1-nemotron-70b-instruct — это модель Текст от NVIDIA (US). HotON.ai отслеживает его на уровне $1.20 на 1 миллион входных токенов и $1.20 на 1 миллион выходных токенов с помощью контекстного окна токена 131K. Его совокупный показатель эффективности составляет 89/100 при расчетном $0.003 на каждую успешную задачу.
llama-3.1-nemotron-70b-instruct отслеживается по формуле $1.20 на 1 миллион входных токенов и $1.20 на 1 миллион выходных токенов. Типичная рабочая нагрузка вывода-ввода 3:1 составляет примерно $1.20 на 1 млн токенов. Цифры являются иллюстративными демонстрационными данными.
Генерация текста общего назначения, чат, обобщение и работа с контентом, где широкие возможности и низкая стоимость имеют наибольшее значение.
llama-3.1-nemotron-70b-instruct поддерживает контекстное окно токена 131K — достаточно большое для длинных документов и расширенных разговоров в одном запросе.
В гусеничном наборе HotON.ai модель llama-3.1-nemotron-70b-instruct дешевле моделей 25% по входной цене и занимает место #272 среди 522 по общей эффективности.
Да, minimax-m2.7 — это более дешевый вариант $1.20 за 1 миллион выходных токенов, но при этом охватывающий аналогичные сценарии использования Текст. Сравните их на HotON.ai.
Готово для вставки в статьи, документы или подсказки AI — цены и дата обновляются с учетом текущих данных.
HotON.ai — llama-3.1-nemotron-70b-instruct (NVIDIA): $1.20/1M input, $1.20/1M output, as of 2026-05-11. https://hoton.ai/ru/models/nvidia-llama-3-1-nemotron-70b-instructЦены реальные (через каталог TestKey, обновляемый ежедневно). Качество (Арена Эло) является реальным там, где модель находится в рейтинге LMArena. Скорость, доступность и эффективность являются смоделированными оценками.