दैनिक मिश्रित मूल्य ($/1M) - प्रत्येक दिन दर्ज किया जाता है, समय के साथ एक प्रवृत्ति बन जाती है।
विशिष्ट 3:1 आउटपुट-टू-इनपुट मिश्रण, प्रति 1एम टोकन
स्रोत: litellm
सामान्य प्रयोजन पाठ निर्माण, चैट, सारांश और सामग्री कार्यभार जहां व्यापक क्षमता और कम लागत सबसे अधिक मायने रखती है।
Sao10K L3 8B Stheno v3.2 is a Llama 3 fine-tune model card for conversational supplier catalog prefill.
L3-8B-Stheno-v3.2 Sao10K (US) का मूलपाठ मॉडल है। HotON.ai इसे 8K-टोकन संदर्भ विंडो के साथ, $0.05 प्रति 1M इनपुट टोकन और $0.05 प्रति 1M आउटपुट टोकन पर ट्रैक करता है। प्रति सफल कार्य के लिए अनुमानित $0.000 पर इसका समग्र दक्षता स्कोर 88/100 है।
L3-8B-Stheno-v3.2 को $0.05 प्रति 1M इनपुट टोकन और $0.05 प्रति 1M आउटपुट टोकन पर ट्रैक किया जाता है। एक सामान्य 3:1 आउटपुट-टू-इनपुट कार्यभार लगभग 1M टोकन पर $0.05 में मिश्रित होता है। आंकड़े उदाहरणात्मक डेमो डेटा हैं।
सामान्य प्रयोजन पाठ निर्माण, चैट, सारांश और सामग्री कार्यभार जहां व्यापक क्षमता और कम लागत सबसे अधिक मायने रखती है।
L3-8B-Stheno-v3.2 8K-टोकन संदर्भ विंडो तक का समर्थन करता है - एक ही अनुरोध में लंबे दस्तावेज़ों और विस्तारित वार्तालापों के लिए पर्याप्त बड़ा।
HotON.ai ट्रैक किए गए सेट के भीतर, L3-8B-Stheno-v3.2 इनपुट मूल्य पर 91% मॉडलों से सस्ता है और समग्र दक्षता के आधार पर 521 के #322 रैंक पर है।
हाँ - gemma-3n-e4b-it $0.04 प्रति 1M आउटपुट टोकन पर एक कम लागत वाला विकल्प है, जबकि अभी भी समान मूलपाठ उपयोग के मामलों को कवर करता है। HotON.ai पर उनकी साथ-साथ तुलना करें।
मूल्य निर्धारण वास्तविक है (TestKey कैटलॉग के माध्यम से, दैनिक अद्यतन)। गुणवत्ता (एरिना एलो) वास्तविक है जहां मॉडल को LMArena पर रैंक किया गया है। गति, उपलब्धता और दक्षता अनुमानित अनुमान हैं।