Täglicher gemischter Preis ($/1 Mio.) – wird jeden Tag aufgezeichnet und bildet im Laufe der Zeit einen Trend.
Typischer 3:1-Output-to-Input-Mix pro 1 Mio. Token
Preis ab 2026-05-11 · Quelle: nvidia_reference_catalog
Universelle Textgenerierung, Chat, Zusammenfassung und Content-Workloads, bei denen umfassende Funktionalität und niedrige Kosten am wichtigsten sind.
Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) vi...
llama-3.3-nemotron-super-49b-v1.5 ist ein Text-Modell von NVIDIA (US). HotON.ai verfolgt es bei $0.10 pro 1 Mio. Eingabe-Tokens und $0.40 pro 1 Mio. Ausgabe-Tokens mit einem 131K-Token-Kontextfenster. Sein zusammengesetzter Effizienzwert beträgt 89/100 bei einem geschätzten $0.000 pro erfolgreicher Aufgabe.
llama-3.3-nemotron-super-49b-v1.5 wird bei $0.10 pro 1 Mio. Eingabe-Tokens und $0.40 pro 1 Mio. Ausgabe-Tokens verfolgt. Eine typische 3:1-Ausgabe-zu-Eingabe-Arbeitslast ergibt ungefähr $0.33 pro 1 Mio. Token. Bei den Zahlen handelt es sich um illustrative Demodaten.
Universelle Textgenerierung, Chat, Zusammenfassung und Content-Workloads, bei denen umfassende Funktionalität und niedrige Kosten am wichtigsten sind.
llama-3.3-nemotron-super-49b-v1.5 unterstützt bis zu einem 131K-Token-Kontextfenster – groß genug für lange Dokumente und längere Konversationen in einer einzigen Anfrage.
Innerhalb des von HotON.ai erfassten Bestands ist llama-3.3-nemotron-super-49b-v1.5 beim Eingabepreis günstiger als 78% der Modelle und liegt nach Gesamteffizienz auf Platz 166 von 521.
Ja – deepseek/deepseek-v4-flash ist eine kostengünstigere Option bei $0.28 pro 1 Million Ausgabe-Tokens, deckt aber dennoch ähnliche Text-Anwendungsfälle ab. Vergleichen Sie sie nebeneinander auf HotON.ai.
Die Preise sind real (über den TestKey-Katalog, täglich aktualisiert). Qualität (Arena Elo) ist real, wenn das Modell auf der LMArena-Rangliste steht. Geschwindigkeit, Verfügbarkeit und Effizienz sind modellierte Schätzungen.