दैनिक मिश्रित मूल्य ($/1M) - प्रत्येक दिन दर्ज किया जाता है, समय के साथ एक प्रवृत्ति बन जाती है।
विशिष्ट 3:1 आउटपुट-टू-इनपुट मिश्रण, प्रति 1एम टोकन
कीमत 2026-05-11 के अनुसार · स्रोत: baseten_reference_catalog
सामान्य प्रयोजन पाठ निर्माण, चैट, सारांश और सामग्री कार्यभार जहां व्यापक क्षमता और कम लागत सबसे अधिक मायने रखती है।
Baseten Model API route for Nemotron Super, adding a long-context NVIDIA reasoning row with managed Model API pricing fields.
nvidia/Nemotron-120B-A12B Baseten Model APIs (US) का मूलपाठ मॉडल है। HotON.ai इसे 202K-टोकन संदर्भ विंडो के साथ, $0.30 प्रति 1M इनपुट टोकन और $0.75 प्रति 1M आउटपुट टोकन पर ट्रैक करता है। प्रति सफल कार्य के लिए अनुमानित $0.001 पर इसका समग्र दक्षता स्कोर 90/100 है।
nvidia/Nemotron-120B-A12B को $0.30 प्रति 1M इनपुट टोकन और $0.75 प्रति 1M आउटपुट टोकन पर ट्रैक किया जाता है। एक सामान्य 3:1 आउटपुट-टू-इनपुट कार्यभार लगभग 1M टोकन पर $0.64 में मिश्रित होता है। आंकड़े उदाहरणात्मक डेमो डेटा हैं।
सामान्य प्रयोजन पाठ निर्माण, चैट, सारांश और सामग्री कार्यभार जहां व्यापक क्षमता और कम लागत सबसे अधिक मायने रखती है।
nvidia/Nemotron-120B-A12B 202K-टोकन संदर्भ विंडो तक का समर्थन करता है - एक ही अनुरोध में लंबे दस्तावेज़ों और विस्तारित वार्तालापों के लिए पर्याप्त बड़ा।
HotON.ai ट्रैक किए गए सेट के भीतर, nvidia/Nemotron-120B-A12B इनपुट मूल्य पर 50% मॉडलों से सस्ता है और समग्र दक्षता के आधार पर 521 के #83 रैंक पर है।
हाँ - deepseek/deepseek-v4-flash $0.28 प्रति 1M आउटपुट टोकन पर एक कम लागत वाला विकल्प है, जबकि अभी भी समान मूलपाठ उपयोग के मामलों को कवर करता है। HotON.ai पर उनकी साथ-साथ तुलना करें।
मूल्य निर्धारण वास्तविक है (TestKey कैटलॉग के माध्यम से, दैनिक अद्यतन)। गुणवत्ता (एरिना एलो) वास्तविक है जहां मॉडल को LMArena पर रैंक किया गया है। गति, उपलब्धता और दक्षता अनुमानित अनुमान हैं।