Insgesamt 1 Mio. US-Dollar für alle getrackten Versionen dieser Linie.
Typischer 3:1-Output-to-Input-Mix pro 1 Mio. Token
Quelle: litellm
Universelle Textgenerierung, Chat, Zusammenfassung und Content-Workloads, bei denen umfassende Funktionalität und niedrige Kosten am wichtigsten sind.
GLM-5 is Z.ai’s flagship open-source foundation model engineered for complex systems design and long-horizon agent workflows. Built for expert developers, it delivers production-grade performance on large-scale progra...
glm-5 ist ein Text-Modell von Zhipu AI (GLM) (CN). HotON.ai verfolgt es bei $0.95 pro 1 Mio. Eingabe-Tokens und $3.15 pro 1 Mio. Ausgabe-Tokens mit einem 203K-Token-Kontextfenster. Sein zusammengesetzter Effizienzwert beträgt 88/100 bei einem geschätzten $0.003 pro erfolgreicher Aufgabe.
glm-5 wird bei $0.95 pro 1 Mio. Eingabe-Tokens und $3.15 pro 1 Mio. Ausgabe-Tokens verfolgt. Eine typische 3:1-Ausgabe-zu-Eingabe-Arbeitslast ergibt ungefähr $2.60 pro 1 Mio. Token. Bei den Zahlen handelt es sich um illustrative Demodaten.
Universelle Textgenerierung, Chat, Zusammenfassung und Content-Workloads, bei denen umfassende Funktionalität und niedrige Kosten am wichtigsten sind.
glm-5 unterstützt bis zu einem 203K-Token-Kontextfenster – groß genug für lange Dokumente und längere Konversationen in einer einzigen Anfrage.
Innerhalb des von HotON.ai erfassten Bestands ist glm-5 beim Eingabepreis günstiger als 30% der Modelle und liegt nach Gesamteffizienz auf Platz 399 von 521.
Ja – minimax-m2.5 ist eine kostengünstigere Option bei $0.99 pro 1 Million Ausgabe-Tokens, deckt aber dennoch ähnliche Text-Anwendungsfälle ab. Vergleichen Sie sie nebeneinander auf HotON.ai.
Die Preise sind real (über den TestKey-Katalog, täglich aktualisiert). Qualität (Arena Elo) ist real, wenn das Modell auf der LMArena-Rangliste steht. Geschwindigkeit, Verfügbarkeit und Effizienz sind modellierte Schätzungen.