Täglicher gemischter Preis ($/1 Mio.) – wird jeden Tag aufgezeichnet und bildet im Laufe der Zeit einen Trend.
Typischer 3:1-Output-to-Input-Mix pro 1 Mio. Token
Preis ab 2026-04-28 · Quelle: legacy_model_catalog
Komplexe Überlegungen, Analysen, Planungen und mehrstufige Problemlösungen, bei denen die Qualität der Antworten wichtiger ist als die reinen Kosten.
QwQ is the reasoning model of the Qwen series. Compared with conventional instruction-tuned models, QwQ, which is capable of thinking and reasoning, can achieve significantly enhanced performance in downstream tasks,...
qwq-32b ist ein Argumentation-Modell von Alibaba Cloud · Qwen (CN). HotON.ai verfolgt es bei $0.15 pro 1 Mio. Eingabe-Tokens und $0.58 pro 1 Mio. Ausgabe-Tokens mit einem 131K-Token-Kontextfenster. Sein zusammengesetzter Effizienzwert beträgt 89/100 bei einem geschätzten $0.001 pro erfolgreicher Aufgabe.
qwq-32b wird bei $0.15 pro 1 Mio. Eingabe-Tokens und $0.58 pro 1 Mio. Ausgabe-Tokens verfolgt. Eine typische 3:1-Ausgabe-zu-Eingabe-Arbeitslast ergibt ungefähr $0.47 pro 1 Mio. Token. Bei den Zahlen handelt es sich um illustrative Demodaten.
Komplexe Überlegungen, Analysen, Planungen und mehrstufige Problemlösungen, bei denen die Qualität der Antworten wichtiger ist als die reinen Kosten.
qwq-32b unterstützt bis zu einem 131K-Token-Kontextfenster – groß genug für lange Dokumente und längere Konversationen in einer einzigen Anfrage.
Innerhalb des von HotON.ai erfassten Bestands ist qwq-32b beim Eingabepreis günstiger als 69% der Modelle und liegt nach Gesamteffizienz auf Platz 216 von 521.
Ja – grok-4-1-fast-non-reasoning ist eine kostengünstigere Option bei $0.50 pro 1 Million Ausgabe-Tokens, deckt aber dennoch ähnliche Argumentation-Anwendungsfälle ab. Vergleichen Sie sie nebeneinander auf HotON.ai.
Die Preise sind real (über den TestKey-Katalog, täglich aktualisiert). Qualität (Arena Elo) ist real, wenn das Modell auf der LMArena-Rangliste steht. Geschwindigkeit, Verfügbarkeit und Effizienz sind modellierte Schätzungen.