Täglicher gemischter Preis ($/1 Mio.) – wird jeden Tag aufgezeichnet und bildet im Laufe der Zeit einen Trend.
Typischer 3:1-Output-to-Input-Mix pro 1 Mio. Token
Preis ab 2026-05-10 · Quelle: baidu_qianfan_official_pricing
Komplexe Überlegungen, Analysen, Planungen und mehrstufige Problemlösungen, bei denen die Qualität der Antworten wichtiger ist als die reinen Kosten.
ERNIE-4.5-21B-A3B-Thinking is Baidu's upgraded lightweight MoE model, refined to boost reasoning depth and quality for top-tier performance in logical puzzles, math, science, coding, text generation, and expert-level...
ernie-4.5-21b-a3b-thinking ist ein Argumentation-Modell von Baidu Wenxin (CN). HotON.ai verfolgt es bei $0.07 pro 1 Mio. Eingabe-Tokens und $0.28 pro 1 Mio. Ausgabe-Tokens mit einem 131K-Token-Kontextfenster. Sein zusammengesetzter Effizienzwert beträgt 89/100 bei einem geschätzten $0.000 pro erfolgreicher Aufgabe.
ernie-4.5-21b-a3b-thinking wird bei $0.07 pro 1 Mio. Eingabe-Tokens und $0.28 pro 1 Mio. Ausgabe-Tokens verfolgt. Eine typische 3:1-Ausgabe-zu-Eingabe-Arbeitslast ergibt ungefähr $0.23 pro 1 Mio. Token. Bei den Zahlen handelt es sich um illustrative Demodaten.
Komplexe Überlegungen, Analysen, Planungen und mehrstufige Problemlösungen, bei denen die Qualität der Antworten wichtiger ist als die reinen Kosten.
ernie-4.5-21b-a3b-thinking unterstützt bis zu einem 131K-Token-Kontextfenster – groß genug für lange Dokumente und längere Konversationen in einer einzigen Anfrage.
Innerhalb des von HotON.ai erfassten Bestands ist ernie-4.5-21b-a3b-thinking beim Eingabepreis günstiger als 88% der Modelle und liegt nach Gesamteffizienz auf Platz 226 von 521.
Die Preise sind real (über den TestKey-Katalog, täglich aktualisiert). Qualität (Arena Elo) ist real, wenn das Modell auf der LMArena-Rangliste steht. Geschwindigkeit, Verfügbarkeit und Effizienz sind modellierte Schätzungen.