Дневная смешанная цена ($/1 миллион) — регистрируется каждый день и со временем превращается в тренд.
Типичное соотношение вывода и ввода 3:1 на 1 млн токенов
Цена по состоянию на 2026-05-11 · Источник: meta_reference_catalog
Смешанные рабочие нагрузки с текстом, изображениями, аудио и документами, которые выигрывают от использования одной модели во всех модальностях.
Llama Guard 4 is a Llama 4 Scout-derived multimodal pretrained model, fine-tuned for content safety classification. Similar to previous versions, it can be used to classify content in both LLM...
llama-guard-4-12b — это модель Мультимодальный от Meta (US). HotON.ai отслеживает его на уровне $0.18 на 1 миллион входных токенов и $0.18 на 1 миллион выходных токенов с помощью контекстного окна токена 164K. Его совокупный показатель эффективности составляет 90/100 при расчетном $0.000 на каждую успешную задачу.
llama-guard-4-12b отслеживается по формуле $0.18 на 1 миллион входных токенов и $0.18 на 1 миллион выходных токенов. Типичная рабочая нагрузка вывода-ввода 3:1 составляет примерно $0.18 на 1 млн токенов. Цифры являются иллюстративными демонстрационными данными.
Смешанные рабочие нагрузки с текстом, изображениями, аудио и документами, которые выигрывают от использования одной модели во всех модальностях.
llama-guard-4-12b поддерживает контекстное окно токена 164K — достаточно большое для длинных документов и расширенных разговоров в одном запросе.
В гусеничном наборе HotON.ai модель llama-guard-4-12b дешевле моделей 68% по входной цене и занимает место #67 среди 521 по общей эффективности.
Да, qwen3.5-flash-02-23 — это более дешевый вариант $0.26 за 1 миллион выходных токенов, но при этом охватывающий аналогичные сценарии использования Мультимодальный. Сравните их на HotON.ai.
Цены реальные (через каталог TestKey, обновляемый ежедневно). Качество (Арена Эло) является реальным там, где модель находится в рейтинге LMArena. Скорость, доступность и эффективность являются смоделированными оценками.