USTextLLAMA-3.3-NEMO Live · täglich aktualisiert

llama-3.3-nemotron-super-49b-v1.5

NVIDIA

Effizienzbewertung

89/100

Eingabepreis

$0.10/ 1 Mio. Token

Ausgabepreis

$0.40/ 1 Mio. Token

Kontextfenster

131K

Mischpreis

$0.33/ 1 Mio. Token

Kosten / Aufgabe

$0.000

Preissenkungsalarm

Erhalten Sie eine E-Mail, wenn der Mischpreis dieses Modells sinkt. Kein Konto erforderlich.

Eine E-Mail pro Drop. Abmelden jederzeit möglich.

Fähigkeiten

Akzeptiert (Eingabe)

Text

Erzeugt (Ausgabe)

Text

Preis im Laufe der Zeit

Täglicher gemischter Preis ($/1 Mio.) – wird jeden Tag aufgezeichnet und bildet im Laufe der Zeit einen Trend.

Preisaufschlüsselung

Eingabepreis

$0.10/ 1 Mio. Token

$0.0001 / 1K

Ausgabepreis

$0.40/ 1 Mio. Token

$0.0004 / 1K

Mischpreis

$0.33/ 1 Mio. Token

$0.0003 / 1K

Typischer 3:1-Output-to-Input-Mix pro 1 Mio. Token

Preis ab 2026-05-11 · Quelle: nvidia_reference_catalog

Geschätzte monatliche Kosten nach Arbeitslast

Chat-Assistent

$78.00/ Mo

1.000 Eingänge · 400 Ausgänge · 10.000 Anforderungen/Tag

RAG / langer Kontext

$156.00/ Mo

8.000 Eingänge · 600 Ausgänge · 5.000 erforderlich/Tag

Verwendung von Agenten/Tools

$216.00/ Mo

3.000 Eingänge · 1,5.000 Ausgänge · 8.000 erforderlich/Tag

Schätzen Sie Ihre Kosten →

Marktposition

Günstiger als 79 % der Raupenmodelle
Größerer Kontext als 39 % der verfolgten Modelle
Effizienzrang: #155 von 535

Bestens geeignet für

Universelle Textgenerierung, Chat, Zusammenfassung und Content-Workloads, bei denen umfassende Funktionalität und niedrige Kosten am wichtigsten sind.

Über llama-3.3-nemotron-super-49b-v1.5

Llama-3.3-Nemotron-Super-49B-v1.5 ist ein 49B-Parameter-Reasoning/chat-Modell, das aus Meta's Llama-3.3-70B-Instruct abgeleitet ist und einen 128K-Kontext hat. Es ist post-geschult für agente Workflows (RAG, Tool Calling) vi...

llama-3.3-nemotron-super-49b-v1.5 ist ein Text-Modell von NVIDIA (US). HotON.ai verfolgt es bei $0.10 pro 1 Mio. Eingabe-Tokens und $0.40 pro 1 Mio. Ausgabe-Tokens mit einem 131K-Token-Kontextfenster. Sein zusammengesetzter Effizienzwert beträgt 89/100 bei einem geschätzten $0.000 pro erfolgreicher Aufgabe.

Vergleiche llama-3.3-nemotron-super-49b-v1.5

LLAMA-3.3-NEMO vs LLAMA-3.1-8B-I LLAMA-3.3-NEMO vs MERCURY-2-INST LLAMA-3.3-NEMO vs MORPH-RERANK-V LLAMA-3.3-NEMO vs SOLAR-PRO-3

Häufig gestellte Fragen

Wie viel kostet llama-3.3-nemotron-super-49b-v1.5 pro 1 Mio. Token?+

llama-3.3-nemotron-super-49b-v1.5 wird bei $0.10 pro 1 Mio. Eingabe-Tokens und $0.40 pro 1 Mio. Ausgabe-Tokens verfolgt. Eine typische 3:1-Ausgabe-zu-Eingabe-Arbeitslast ergibt ungefähr $0.33 pro 1 Mio. Token. Bei den Zahlen handelt es sich um illustrative Demodaten.

Wofür eignet sich llama-3.3-nemotron-super-49b-v1.5 am besten?+

Universelle Textgenerierung, Chat, Zusammenfassung und Content-Workloads, bei denen umfassende Funktionalität und niedrige Kosten am wichtigsten sind.

Wie groß ist das Kontextfenster von llama-3.3-nemotron-super-49b-v1.5?+

llama-3.3-nemotron-super-49b-v1.5 unterstützt bis zu einem 131K-Token-Kontextfenster – groß genug für lange Dokumente und längere Konversationen in einer einzigen Anfrage.

Ist llama-3.3-nemotron-super-49b-v1.5 günstiger als andere KI-Modelle?+

Innerhalb des von HotON.ai erfassten Bestands ist llama-3.3-nemotron-super-49b-v1.5 beim Eingabepreis günstiger als 79% der Modelle und liegt nach Gesamteffizienz auf Platz 155 von 535.

Gibt es eine günstigere Alternative zu llama-3.3-nemotron-super-49b-v1.5?+

Ja – deepseek/deepseek-v4-flash ist eine kostengünstigere Option bei $0.28 pro 1 Million Ausgabe-Tokens, deckt aber dennoch ähnliche Text-Anwendungsfälle ab. Vergleichen Sie sie nebeneinander auf HotON.ai.

Zitieren Sie dieses Modell

Bereit zum Einfügen in Artikel, Papiere oder KI-Eingabeaufforderungen – Preise und Datum werden mit den Live-Daten aktualisiert.

HotON.ai — llama-3.3-nemotron-super-49b-v1.5 (NVIDIA): $0.10/1M input, $0.40/1M output, as of 2026-05-11. https://hoton.ai/de/models/nvidia-llama-3-3-nemotron-super-49b-v1-5

Verwandte Modelle

Die Preise sind real (über den TestKey-Katalog, täglich aktualisiert). Qualität (Arena Elo) ist real, wenn das Modell auf der LMArena-Rangliste steht. Effizienz ist eine modellierte Kombination aus realem Preis und Kontext.