दैनिक मिश्रित मूल्य ($/1M) - प्रत्येक दिन दर्ज किया जाता है, समय के साथ एक प्रवृत्ति बन जाती है।
विशिष्ट 3:1 आउटपुट-टू-इनपुट मिश्रण, प्रति 1एम टोकन
स्रोत: litellm
मिश्रित पाठ, छवि, ऑडियो और दस्तावेज़ कार्यभार जो सभी तौर-तरीकों में एक मॉडल से लाभान्वित होते हैं।
Alpindale Llama 3.2 11B Vision Instruct is a vision-language model card for image understanding supplier prefill.
Llama-3.2-11B-Vision-Instruct Alpindale (US) का बहुविध मॉडल है। HotON.ai इसे 131K-टोकन संदर्भ विंडो के साथ, $0.37 प्रति 1M इनपुट टोकन और $0.37 प्रति 1M आउटपुट टोकन पर ट्रैक करता है। प्रति सफल कार्य के लिए अनुमानित $0.001 पर इसका समग्र दक्षता स्कोर 89/100 है।
Llama-3.2-11B-Vision-Instruct को $0.37 प्रति 1M इनपुट टोकन और $0.37 प्रति 1M आउटपुट टोकन पर ट्रैक किया जाता है। एक सामान्य 3:1 आउटपुट-टू-इनपुट कार्यभार लगभग 1M टोकन पर $0.37 में मिश्रित होता है। आंकड़े उदाहरणात्मक डेमो डेटा हैं।
मिश्रित पाठ, छवि, ऑडियो और दस्तावेज़ कार्यभार जो सभी तौर-तरीकों में एक मॉडल से लाभान्वित होते हैं।
Llama-3.2-11B-Vision-Instruct 131K-टोकन संदर्भ विंडो तक का समर्थन करता है - एक ही अनुरोध में लंबे दस्तावेज़ों और विस्तारित वार्तालापों के लिए पर्याप्त बड़ा।
HotON.ai ट्रैक किए गए सेट के भीतर, Llama-3.2-11B-Vision-Instruct इनपुट मूल्य पर 49% मॉडलों से सस्ता है और समग्र दक्षता के आधार पर 521 के #237 रैंक पर है।
हाँ - gpt-4.1-nano $0.40 प्रति 1M आउटपुट टोकन पर एक कम लागत वाला विकल्प है, जबकि अभी भी समान बहुविध उपयोग के मामलों को कवर करता है। HotON.ai पर उनकी साथ-साथ तुलना करें।
मूल्य निर्धारण वास्तविक है (TestKey कैटलॉग के माध्यम से, दैनिक अद्यतन)। गुणवत्ता (एरिना एलो) वास्तविक है जहां मॉडल को LMArena पर रैंक किया गया है। गति, उपलब्धता और दक्षता अनुमानित अनुमान हैं।