दैनिक मिश्रित मूल्य ($/1M) - प्रत्येक दिन दर्ज किया जाता है, समय के साथ एक प्रवृत्ति बन जाती है।
विशिष्ट 3:1 आउटपुट-टू-इनपुट मिश्रण, प्रति 1एम टोकन
कीमत 2026-05-11 के अनुसार · स्रोत: nvidia_reference_catalog
सामान्य प्रयोजन पाठ निर्माण, चैट, सारांश और सामग्री कार्यभार जहां व्यापक क्षमता और कम लागत सबसे अधिक मायने रखती है।
Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) vi...
llama-3.3-nemotron-super-49b-v1.5 NVIDIA (US) का मूलपाठ मॉडल है। HotON.ai इसे 131K-टोकन संदर्भ विंडो के साथ, $0.10 प्रति 1M इनपुट टोकन और $0.40 प्रति 1M आउटपुट टोकन पर ट्रैक करता है। प्रति सफल कार्य के लिए अनुमानित $0.000 पर इसका समग्र दक्षता स्कोर 89/100 है।
llama-3.3-nemotron-super-49b-v1.5 को $0.10 प्रति 1M इनपुट टोकन और $0.40 प्रति 1M आउटपुट टोकन पर ट्रैक किया जाता है। एक सामान्य 3:1 आउटपुट-टू-इनपुट कार्यभार लगभग 1M टोकन पर $0.33 में मिश्रित होता है। आंकड़े उदाहरणात्मक डेमो डेटा हैं।
सामान्य प्रयोजन पाठ निर्माण, चैट, सारांश और सामग्री कार्यभार जहां व्यापक क्षमता और कम लागत सबसे अधिक मायने रखती है।
llama-3.3-nemotron-super-49b-v1.5 131K-टोकन संदर्भ विंडो तक का समर्थन करता है - एक ही अनुरोध में लंबे दस्तावेज़ों और विस्तारित वार्तालापों के लिए पर्याप्त बड़ा।
HotON.ai ट्रैक किए गए सेट के भीतर, llama-3.3-nemotron-super-49b-v1.5 इनपुट मूल्य पर 78% मॉडलों से सस्ता है और समग्र दक्षता के आधार पर 521 के #166 रैंक पर है।
हाँ - deepseek/deepseek-v4-flash $0.28 प्रति 1M आउटपुट टोकन पर एक कम लागत वाला विकल्प है, जबकि अभी भी समान मूलपाठ उपयोग के मामलों को कवर करता है। HotON.ai पर उनकी साथ-साथ तुलना करें।
मूल्य निर्धारण वास्तविक है (TestKey कैटलॉग के माध्यम से, दैनिक अद्यतन)। गुणवत्ता (एरिना एलो) वास्तविक है जहां मॉडल को LMArena पर रैंक किया गया है। गति, उपलब्धता और दक्षता अनुमानित अनुमान हैं।