Echte menschliche Präferenz-Elo von LMArena, blinde Kopf-an-Kopf-Abstimmungen. Höher ist besser; – bedeutet, dass er noch nicht in dieser Arena gerankt ist. Dies ist eine Messung, nicht unsere Schätzung.
Täglicher gemischter Preis ($/1 Mio.) – wird jeden Tag aufgezeichnet und bildet im Laufe der Zeit einen Trend.
Typischer 3:1-Output-to-Input-Mix pro 1 Mio. Token
Quelle: litellm
Gemischte Text-, Bild-, Audio- und Dokument-Workloads, die modalitätsübergreifend von einem Modell profitieren.
Azure OpenAI deployment reference for GPT-5.1 Chat preview; actual deployment name, API version, and region are customer-specific.
gpt-5.1-chat ist ein Multimodal-Modell von Azure OpenAI (US). HotON.ai verfolgt es bei $1.38 pro 1 Mio. Eingabe-Tokens und $11.00 pro 1 Mio. Ausgabe-Tokens mit einem 128K-Token-Kontextfenster. Sein zusammengesetzter Effizienzwert beträgt 84/100 bei einem geschätzten $0.008 pro erfolgreicher Aufgabe.
gpt-5.1-chat wird bei $1.38 pro 1 Mio. Eingabe-Tokens und $11.00 pro 1 Mio. Ausgabe-Tokens verfolgt. Eine typische 3:1-Ausgabe-zu-Eingabe-Arbeitslast ergibt ungefähr $8.60 pro 1 Mio. Token. Bei den Zahlen handelt es sich um illustrative Demodaten.
Gemischte Text-, Bild-, Audio- und Dokument-Workloads, die modalitätsübergreifend von einem Modell profitieren.
gpt-5.1-chat unterstützt bis zu einem 128K-Token-Kontextfenster – groß genug für lange Dokumente und längere Konversationen in einer einzigen Anfrage.
Innerhalb des von HotON.ai erfassten Bestands ist gpt-5.1-chat beim Eingabepreis günstiger als 21% der Modelle und liegt nach Gesamteffizienz auf Platz 471 von 521.
Ja – gpt-4.1-nano ist eine kostengünstigere Option bei $0.40 pro 1 Million Ausgabe-Tokens, deckt aber dennoch ähnliche Multimodal-Anwendungsfälle ab. Vergleichen Sie sie nebeneinander auf HotON.ai.
Die Preise sind real (über den TestKey-Katalog, täglich aktualisiert). Qualität (Arena Elo) ist real, wenn das Modell auf der LMArena-Rangliste steht. Geschwindigkeit, Verfügbarkeit und Effizienz sind modellierte Schätzungen.