Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.
Tipico mix output-input 3:1, per 1 milione di token
Prezzo a partire da 2026-04-28 · Fonte: legacy_model_catalog
Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.
GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications. Like GLM-4.5, it adopts the Mixture-of-Experts (MoE) architecture but with a more compact...
glm-4.5-air è un modello Testo di Zhipu AI (GLM) (CN). HotON.ai lo tiene traccia di $0.13 per 1 milione di token di input e $0.85 per 1 milione di token di output, con una finestra di contesto del token 131K. Il suo punteggio di efficienza composito è 89/100 con un $0.001 stimato per attività riuscita.
glm-4.5-air viene tracciato su $0.13 per 1 milione di token di input e $0.85 per 1 milione di token di output. Un tipico carico di lavoro output-to-input 3:1 si riduce a circa $0.67 per 1 milione di token. Le cifre sono dati dimostrativi illustrativi.
Carichi di lavoro generici per la generazione di testi, chat, riepiloghi e contenuti in cui contano di più l'ampia capacità e il basso costo.
glm-4.5-air supporta fino a una finestra di contesto del token 131K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.
All'interno dell'insieme tracciato HotON.ai, glm-4.5-air è più economico della 75% dei modelli sul prezzo di input e si classifica #172 di 521 in base all'efficienza complessiva.
Sì: deepseek/deepseek-v4-flash è un'opzione a costo inferiore a $0.28 per 1 milione di token di output, pur coprendo casi d'uso Testo simili. Confrontali fianco a fianco su HotON.ai.
Il prezzo è reale (tramite il catalogo TestKey, aggiornato quotidianamente). La qualità (Arena Elo) è reale quando il modello è classificato su LMArena. Velocità, disponibilità ed efficienza sono stime modellate.