Prix mixte quotidien (1 million de dollars) — enregistré chaque jour, se transforme en tendance au fil du temps.
Mélange sortie-entrée typique 3:1, par million de jetons
Prix à partir du 2026-05-11 · Source: nvidia_reference_catalog
Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.
Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) vi...
llama-3.3-nemotron-super-49b-v1.5 est un modèle Texte de NVIDIA (US). HotON.ai le suit à $0.10 par 1 million de jetons d'entrée et $0.40 par 1 million de jetons de sortie, avec une fenêtre contextuelle de jeton 131K. Son score d'efficacité composite est de 89/100 avec une estimation de $0.000 par tâche réussie.
llama-3.3-nemotron-super-49b-v1.5 est suivi à $0.10 par 1 million de jetons d'entrée et à $0.40 par 1 million de jetons de sortie. Une charge de travail typique de 3:1 sortie-entrée se mélange à environ $0.33 pour 1 million de jetons. Les chiffres sont des données de démonstration illustratives.
Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.
llama-3.3-nemotron-super-49b-v1.5 prend en charge jusqu'à une fenêtre contextuelle de jeton 131K — suffisamment grande pour des documents longs et des conversations étendues en une seule requête.
Dans l'ensemble suivi HotON.ai, llama-3.3-nemotron-super-49b-v1.5 est moins cher que 78% des modèles en termes de prix d'entrée et se classe #166 de 521 en termes d'efficacité globale.
Oui — deepseek/deepseek-v4-flash est une option moins coûteuse à $0.28 par 1 million de jetons de sortie, tout en couvrant des cas d'utilisation similaires de Texte. Comparez-les côte à côte sur HotON.ai.
Le prix est réel (via le catalogue TestKey, mis à jour quotidiennement). La qualité (Arena Elo) est réelle là où le modèle est classé sur LMArena. La vitesse, la disponibilité et l'efficacité sont des estimations modélisées.