दैनिक मिश्रित मूल्य ($/1M) - प्रत्येक दिन दर्ज किया जाता है, समय के साथ एक प्रवृत्ति बन जाती है।
विशिष्ट 3:1 आउटपुट-टू-इनपुट मिश्रण, प्रति 1एम टोकन
कीमत 2026-05-11 के अनुसार · स्रोत: nvidia_reference_catalog
सामान्य प्रयोजन पाठ निर्माण, चैट, सारांश और सामग्री कार्यभार जहां व्यापक क्षमता और कम लागत सबसे अधिक मायने रखती है।
NVIDIA's Llama 3.1 Nemotron 70B is a language model designed for generating precise and useful responses. Leveraging Llama 3.1 70B architecture and Reinforcement Learning from Human Feedback (RLHF), it excels...
llama-3.1-nemotron-70b-instruct NVIDIA (US) का मूलपाठ मॉडल है। HotON.ai इसे 131K-टोकन संदर्भ विंडो के साथ, $1.20 प्रति 1M इनपुट टोकन और $1.20 प्रति 1M आउटपुट टोकन पर ट्रैक करता है। प्रति सफल कार्य के लिए अनुमानित $0.003 पर इसका समग्र दक्षता स्कोर 89/100 है।
llama-3.1-nemotron-70b-instruct को $1.20 प्रति 1M इनपुट टोकन और $1.20 प्रति 1M आउटपुट टोकन पर ट्रैक किया जाता है। एक सामान्य 3:1 आउटपुट-टू-इनपुट कार्यभार लगभग 1M टोकन पर $1.20 में मिश्रित होता है। आंकड़े उदाहरणात्मक डेमो डेटा हैं।
सामान्य प्रयोजन पाठ निर्माण, चैट, सारांश और सामग्री कार्यभार जहां व्यापक क्षमता और कम लागत सबसे अधिक मायने रखती है।
llama-3.1-nemotron-70b-instruct 131K-टोकन संदर्भ विंडो तक का समर्थन करता है - एक ही अनुरोध में लंबे दस्तावेज़ों और विस्तारित वार्तालापों के लिए पर्याप्त बड़ा।
HotON.ai ट्रैक किए गए सेट के भीतर, llama-3.1-nemotron-70b-instruct इनपुट मूल्य पर 25% मॉडलों से सस्ता है और समग्र दक्षता के आधार पर 521 के #168 रैंक पर है।
हाँ - minimax-m2.5 $0.99 प्रति 1M आउटपुट टोकन पर एक कम लागत वाला विकल्प है, जबकि अभी भी समान मूलपाठ उपयोग के मामलों को कवर करता है। HotON.ai पर उनकी साथ-साथ तुलना करें।
मूल्य निर्धारण वास्तविक है (TestKey कैटलॉग के माध्यम से, दैनिक अद्यतन)। गुणवत्ता (एरिना एलो) वास्तविक है जहां मॉडल को LMArena पर रैंक किया गया है। गति, उपलब्धता और दक्षता अनुमानित अनुमान हैं।