Дневная смешанная цена ($/1 миллион) — регистрируется каждый день и со временем превращается в тренд.
Типичное соотношение вывода и ввода 3:1 на 1 млн токенов
Цена по состоянию на 2026-05-11 · Источник: baseten_reference_catalog
Генерация текста общего назначения, чат, обобщение и работа с контентом, где широкие возможности и низкая стоимость имеют наибольшее значение.
Baseten Model API route for Nemotron Super, adding a long-context NVIDIA reasoning row with managed Model API pricing fields.
nvidia/Nemotron-120B-A12B — это модель Текст от Baseten Model APIs (US). HotON.ai отслеживает его на уровне $0.30 на 1 миллион входных токенов и $0.75 на 1 миллион выходных токенов с помощью контекстного окна токена 202K. Его совокупный показатель эффективности составляет 90/100 при расчетном $0.001 на каждую успешную задачу.
nvidia/Nemotron-120B-A12B отслеживается по формуле $0.30 на 1 миллион входных токенов и $0.75 на 1 миллион выходных токенов. Типичная рабочая нагрузка вывода-ввода 3:1 составляет примерно $0.64 на 1 млн токенов. Цифры являются иллюстративными демонстрационными данными.
Генерация текста общего назначения, чат, обобщение и работа с контентом, где широкие возможности и низкая стоимость имеют наибольшее значение.
nvidia/Nemotron-120B-A12B поддерживает контекстное окно токена 202K — достаточно большое для длинных документов и расширенных разговоров в одном запросе.
В гусеничном наборе HotON.ai модель nvidia/Nemotron-120B-A12B дешевле моделей 50% по входной цене и занимает место #83 среди 521 по общей эффективности.
Да, deepseek/deepseek-v4-flash — это более дешевый вариант $0.28 за 1 миллион выходных токенов, но при этом охватывающий аналогичные сценарии использования Текст. Сравните их на HotON.ai.
Цены реальные (через каталог TestKey, обновляемый ежедневно). Качество (Арена Эло) является реальным там, где модель находится в рейтинге LMArena. Скорость, доступность и эффективность являются смоделированными оценками.