Miscelato $/1 milione tra le versioni tracciate di questa linea.
Tipico mix output-input 3:1, per 1 milione di token
Fonte: litellm
Carichi di lavoro misti di testo, immagini, audio e documenti che beneficiano di un unico modello in tutte le modalità.
GLM-4.6V is a large multimodal model designed for high-fidelity visual understanding and long-context reasoning across images, documents, and mixed media. It supports up to 128K tokens, processes complex page layouts...
glm-4.6v è un modello Multimodale di Zhipu AI (GLM) (CN). HotON.ai lo tiene traccia di $0.30 per 1 milione di token di input e $0.90 per 1 milione di token di output, con una finestra di contesto del token 131K. Il suo punteggio di efficienza composito è 89/100 con un $0.001 stimato per attività riuscita.
glm-4.6v viene tracciato su $0.30 per 1 milione di token di input e $0.90 per 1 milione di token di output. Un tipico carico di lavoro output-to-input 3:1 si riduce a circa $0.75 per 1 milione di token. Le cifre sono dati dimostrativi illustrativi.
Carichi di lavoro misti di testo, immagini, audio e documenti che beneficiano di un unico modello in tutte le modalità.
glm-4.6v supporta fino a una finestra di contesto del token 131K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.
All'interno dell'insieme tracciato HotON.ai, glm-4.6v è più economico della 50% dei modelli sul prezzo di input e si classifica #271 di 521 in base all'efficienza complessiva.
Sì: gpt-4.1-nano è un'opzione a costo inferiore a $0.40 per 1 milione di token di output, pur coprendo casi d'uso Multimodale simili. Confrontali fianco a fianco su HotON.ai.
Il prezzo è reale (tramite il catalogo TestKey, aggiornato quotidianamente). La qualità (Arena Elo) è reale quando il modello è classificato su LMArena. Velocità, disponibilità ed efficienza sono stime modellate.