इस लाइन के ट्रैक किए गए संस्करणों में $/1M का मिश्रण।
विशिष्ट 3:1 आउटपुट-टू-इनपुट मिश्रण, प्रति 1एम टोकन
स्रोत: litellm
सामान्य प्रयोजन पाठ निर्माण, चैट, सारांश और सामग्री कार्यभार जहां व्यापक क्षमता और कम लागत सबसे अधिक मायने रखती है।
OpenAI GPT Realtime 2 is a reasoning realtime voice model for low-latency speech-to-speech interactions and tool use.
gpt-realtime-2 OpenAI (US) का मूलपाठ मॉडल है। HotON.ai इसे 128K-टोकन संदर्भ विंडो के साथ, $4.00 प्रति 1M इनपुट टोकन और $16.00 प्रति 1M आउटपुट टोकन पर ट्रैक करता है। प्रति सफल कार्य के लिए अनुमानित $0.016 पर इसका समग्र दक्षता स्कोर 82/100 है।
gpt-realtime-2 को $4.00 प्रति 1M इनपुट टोकन और $16.00 प्रति 1M आउटपुट टोकन पर ट्रैक किया जाता है। एक सामान्य 3:1 आउटपुट-टू-इनपुट कार्यभार लगभग 1M टोकन पर $13.00 में मिश्रित होता है। आंकड़े उदाहरणात्मक डेमो डेटा हैं।
सामान्य प्रयोजन पाठ निर्माण, चैट, सारांश और सामग्री कार्यभार जहां व्यापक क्षमता और कम लागत सबसे अधिक मायने रखती है।
gpt-realtime-2 128K-टोकन संदर्भ विंडो तक का समर्थन करता है - एक ही अनुरोध में लंबे दस्तावेज़ों और विस्तारित वार्तालापों के लिए पर्याप्त बड़ा।
HotON.ai ट्रैक किए गए सेट के भीतर, gpt-realtime-2 इनपुट मूल्य पर 7% मॉडलों से सस्ता है और समग्र दक्षता के आधार पर 521 के #485 रैंक पर है।
हाँ - minimax-m2.5 $0.99 प्रति 1M आउटपुट टोकन पर एक कम लागत वाला विकल्प है, जबकि अभी भी समान मूलपाठ उपयोग के मामलों को कवर करता है। HotON.ai पर उनकी साथ-साथ तुलना करें।
मूल्य निर्धारण वास्तविक है (TestKey कैटलॉग के माध्यम से, दैनिक अद्यतन)। गुणवत्ता (एरिना एलो) वास्तविक है जहां मॉडल को LMArena पर रैंक किया गया है। गति, उपलब्धता और दक्षता अनुमानित अनुमान हैं।