दैनिक मिश्रित मूल्य ($/1M) - प्रत्येक दिन दर्ज किया जाता है, समय के साथ एक प्रवृत्ति बन जाती है।
विशिष्ट 3:1 आउटपुट-टू-इनपुट मिश्रण, प्रति 1एम टोकन
कीमत 2026-04-28 के अनुसार · स्रोत: legacy_model_catalog
जटिल तर्क, विश्लेषण, योजना और बहु-चरणीय समस्या समाधान जहां उत्तर की गुणवत्ता कच्ची लागत से अधिक मायने रखती है।
QwQ is the reasoning model of the Qwen series. Compared with conventional instruction-tuned models, QwQ, which is capable of thinking and reasoning, can achieve significantly enhanced performance in downstream tasks,...
qwq-32b Alibaba Cloud · Qwen (CN) का तर्क मॉडल है। HotON.ai इसे 131K-टोकन संदर्भ विंडो के साथ, $0.15 प्रति 1M इनपुट टोकन और $0.58 प्रति 1M आउटपुट टोकन पर ट्रैक करता है। प्रति सफल कार्य के लिए अनुमानित $0.001 पर इसका समग्र दक्षता स्कोर 89/100 है।
qwq-32b को $0.15 प्रति 1M इनपुट टोकन और $0.58 प्रति 1M आउटपुट टोकन पर ट्रैक किया जाता है। एक सामान्य 3:1 आउटपुट-टू-इनपुट कार्यभार लगभग 1M टोकन पर $0.47 में मिश्रित होता है। आंकड़े उदाहरणात्मक डेमो डेटा हैं।
जटिल तर्क, विश्लेषण, योजना और बहु-चरणीय समस्या समाधान जहां उत्तर की गुणवत्ता कच्ची लागत से अधिक मायने रखती है।
qwq-32b 131K-टोकन संदर्भ विंडो तक का समर्थन करता है - एक ही अनुरोध में लंबे दस्तावेज़ों और विस्तारित वार्तालापों के लिए पर्याप्त बड़ा।
HotON.ai ट्रैक किए गए सेट के भीतर, qwq-32b इनपुट मूल्य पर 69% मॉडलों से सस्ता है और समग्र दक्षता के आधार पर 521 के #216 रैंक पर है।
हाँ - grok-4-1-fast-non-reasoning $0.50 प्रति 1M आउटपुट टोकन पर एक कम लागत वाला विकल्प है, जबकि अभी भी समान तर्क उपयोग के मामलों को कवर करता है। HotON.ai पर उनकी साथ-साथ तुलना करें।
मूल्य निर्धारण वास्तविक है (TestKey कैटलॉग के माध्यम से, दैनिक अद्यतन)। गुणवत्ता (एरिना एलो) वास्तविक है जहां मॉडल को LMArena पर रैंक किया गया है। गति, उपलब्धता और दक्षता अनुमानित अनुमान हैं।