Смешено 1 миллион долларов США для гусеничных версий этой линейки.
Типичное соотношение вывода и ввода 3:1 на 1 млн токенов
Источник: litellm
Генерация текста общего назначения, чат, обобщение и работа с контентом, где широкие возможности и низкая стоимость имеют наибольшее значение.
GLM-5 is Z.ai’s flagship open-source foundation model engineered for complex systems design and long-horizon agent workflows. Built for expert developers, it delivers production-grade performance on large-scale progra...
glm-5 — это модель Текст от Zhipu AI (GLM) (CN). HotON.ai отслеживает его на уровне $0.95 на 1 миллион входных токенов и $3.15 на 1 миллион выходных токенов с помощью контекстного окна токена 203K. Его совокупный показатель эффективности составляет 88/100 при расчетном $0.003 на каждую успешную задачу.
glm-5 отслеживается по формуле $0.95 на 1 миллион входных токенов и $3.15 на 1 миллион выходных токенов. Типичная рабочая нагрузка вывода-ввода 3:1 составляет примерно $2.60 на 1 млн токенов. Цифры являются иллюстративными демонстрационными данными.
Генерация текста общего назначения, чат, обобщение и работа с контентом, где широкие возможности и низкая стоимость имеют наибольшее значение.
glm-5 поддерживает контекстное окно токена 203K — достаточно большое для длинных документов и расширенных разговоров в одном запросе.
В гусеничном наборе HotON.ai модель glm-5 дешевле моделей 30% по входной цене и занимает место #399 среди 521 по общей эффективности.
Да, minimax-m2.5 — это более дешевый вариант $0.99 за 1 миллион выходных токенов, но при этом охватывающий аналогичные сценарии использования Текст. Сравните их на HotON.ai.
Цены реальные (через каталог TestKey, обновляемый ежедневно). Качество (Арена Эло) является реальным там, где модель находится в рейтинге LMArena. Скорость, доступность и эффективность являются смоделированными оценками.