Смешено 1 миллион долларов США для гусеничных версий этой линейки.
Типичное соотношение вывода и ввода 3:1 на 1 млн токенов
Источник: litellm
Смешанные рабочие нагрузки с текстом, изображениями, аудио и документами, которые выигрывают от использования одной модели во всех модальностях.
GLM-4.6V is a large multimodal model designed for high-fidelity visual understanding and long-context reasoning across images, documents, and mixed media. It supports up to 128K tokens, processes complex page layouts...
glm-4.6v — это модель Мультимодальный от Zhipu AI (GLM) (CN). HotON.ai отслеживает его на уровне $0.30 на 1 миллион входных токенов и $0.90 на 1 миллион выходных токенов с помощью контекстного окна токена 131K. Его совокупный показатель эффективности составляет 89/100 при расчетном $0.001 на каждую успешную задачу.
glm-4.6v отслеживается по формуле $0.30 на 1 миллион входных токенов и $0.90 на 1 миллион выходных токенов. Типичная рабочая нагрузка вывода-ввода 3:1 составляет примерно $0.75 на 1 млн токенов. Цифры являются иллюстративными демонстрационными данными.
Смешанные рабочие нагрузки с текстом, изображениями, аудио и документами, которые выигрывают от использования одной модели во всех модальностях.
glm-4.6v поддерживает контекстное окно токена 131K — достаточно большое для длинных документов и расширенных разговоров в одном запросе.
В гусеничном наборе HotON.ai модель glm-4.6v дешевле моделей 50% по входной цене и занимает место #271 среди 521 по общей эффективности.
Да, gpt-4.1-nano — это более дешевый вариант $0.40 за 1 миллион выходных токенов, но при этом охватывающий аналогичные сценарии использования Мультимодальный. Сравните их на HotON.ai.
Цены реальные (через каталог TestKey, обновляемый ежедневно). Качество (Арена Эло) является реальным там, где модель находится в рейтинге LMArena. Скорость, доступность и эффективность являются смоделированными оценками.