USTexteLLAMA-3.3-NEMO En direct · mis à jour quotidiennement

llama-3.3-nemotron-super-49b-v1.5

NVIDIA

Score d'efficacité

89/100

Prix d'entrée

$0.10/ 1 million de jetons

Prix de sortie

$0.40/ 1 million de jetons

Fenêtre contextuelle

131K

Prix mixte

$0.33/ 1 million de jetons

Coût / tâche

$0.000

Alerte baisse de prix

Recevez un e-mail lorsque le prix mixte de ce modèle baisse. Aucun compte requis.

Un e-mail par dépôt. Désabonnez-vous à tout moment.

Capacités

Accepte (saisie)

Texte

Produit (sortie)

Texte

Prix au fil du temps

Prix mixte quotidien (1 million de dollars) — enregistré chaque jour, se transforme en tendance au fil du temps.

Répartition des prix

Prix d'entrée

$0.10/ 1 million de jetons

$0.0001 / 1K

Prix de sortie

$0.40/ 1 million de jetons

$0.0004 / 1K

Prix mixte

$0.33/ 1 million de jetons

$0.0003 / 1K

Mélange sortie-entrée typique 3:1, par million de jetons

Prix à partir du 2026-05-11 · Source: nvidia_reference_catalog

Coût mensuel estimé par charge de travail

Assistant de discussion

$78.00/ mois

1 000 entrées · 400 sorties · 10 000 demandes/jour

RAG / contexte long

$156.00/ mois

8K en entrée · 600 en sortie · 5K demande/jour

Utilisation des agents/outils

$216.00/ mois

3K en entrée · 1,5K en sortie · 8K demande/jour

Estimez votre coût →

Position sur le marché

Moins cher que 79% des modèles suivis
Contexte plus large que 39% des modèles suivis
Classement d'efficacité: #155 de 535

Idéal pour

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

À propos de llama-3.3-nemotron-super-49b-v1.5

Llama-3.3-Nemotron-Super-49B-v1.5 est un modèle de raisonnement/chat centré sur l'anglais de 49B paramètres, dérivé de Meta's Llama-3.3-70B-Instruct avec un contexte de 128K. Il est post-entraîné pour des workflows agents (RAG, appel d'outils) vi...

llama-3.3-nemotron-super-49b-v1.5 est un modèle Texte de NVIDIA (US). HotON.ai le suit à $0.10 par 1 million de jetons d'entrée et $0.40 par 1 million de jetons de sortie, avec une fenêtre contextuelle de jeton 131K. Son score d'efficacité composite est de 89/100 avec une estimation de $0.000 par tâche réussie.

Comparez llama-3.3-nemotron-super-49b-v1.5

LLAMA-3.3-NEMO vs MERCURY-2-INST LLAMA-3.3-NEMO vs MORPH-RERANK-V LLAMA-3.3-NEMO vs SOLAR-PRO-3 LLAMA-3.3-NEMO vs CYDONIA-24B-V4

Actualités du marché liées

L'agent Rogue AI d'OpenAI a piraté plus qu'un simple câlinil y a 6 heures Cyera accepte d'acquérir Oasis Security pour 1 milliard de dollars afin de protéger les agents d'IA en proliférationil y a 6 heures Création de flux de travail de codage agent non interactifs avec Kimi CLI, le streaming JSONL, les tests et la mémoire de session de Moonshot AIil y a 8 heures

Questions fréquemment posées

Combien coûte llama-3.3-nemotron-super-49b-v1.5 pour 1 million de jetons ?+

llama-3.3-nemotron-super-49b-v1.5 est suivi à $0.10 par 1 million de jetons d'entrée et à $0.40 par 1 million de jetons de sortie. Une charge de travail typique de 3:1 sortie-entrée se mélange à environ $0.33 pour 1 million de jetons. Les chiffres sont des données de démonstration illustratives.

À quoi sert llama-3.3-nemotron-super-49b-v1.5 ?+

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

Quelle est la taille de la fenêtre contextuelle de llama-3.3-nemotron-super-49b-v1.5 ?+

llama-3.3-nemotron-super-49b-v1.5 prend en charge jusqu'à une fenêtre contextuelle de jeton 131K — suffisamment grande pour des documents longs et des conversations étendues en une seule requête.

Le llama-3.3-nemotron-super-49b-v1.5 est-il moins cher que les autres modèles d’IA ?+

Dans l'ensemble suivi HotON.ai, llama-3.3-nemotron-super-49b-v1.5 est moins cher que 79% des modèles en termes de prix d'entrée et se classe #155 de 535 en termes d'efficacité globale.

Existe-t-il une alternative moins chère au llama-3.3-nemotron-super-49b-v1.5 ?+

Oui — deepseek-v4-flash est une option moins coûteuse à $0.28 par 1 million de jetons de sortie, tout en couvrant des cas d'utilisation similaires de Texte. Comparez-les côte à côte sur HotON.ai.

Citer ce modèle

Prêt à coller dans des articles, des articles ou des invites d'IA : les prix et la date sont actualisés avec les données en direct.

HotON.ai — llama-3.3-nemotron-super-49b-v1.5 (NVIDIA): $0.10/1M input, $0.40/1M output, as of 2026-05-11. https://hoton.ai/fr/models/nvidia-llama-3-3-nemotron-super-49b-v1-5

Modèles associés

Le prix est réel (via le catalogue TestKey, mis à jour quotidiennement). La qualité (Arena Elo) est réelle là où le modèle est classé sur LMArena. L’efficacité est un composite modélisé du prix réel et du contexte.

Prix au fil du temps

Prix mixte quotidien (1 million de dollars) — enregistré chaque jour, se transforme en tendance au fil du temps.

Répartition des prix

Prix d'entrée

$0.10/ 1 million de jetons

$0.0001 / 1K

Prix de sortie

$0.40/ 1 million de jetons

$0.0004 / 1K

Prix mixte

$0.33/ 1 million de jetons

$0.0003 / 1K

Mélange sortie-entrée typique 3:1, par million de jetons

Prix à partir du 2026-05-11 · Source: nvidia_reference_catalog

Coût mensuel estimé par charge de travail

Assistant de discussion

$78.00/ mois

1 000 entrées · 400 sorties · 10 000 demandes/jour

RAG / contexte long

$156.00/ mois

8K en entrée · 600 en sortie · 5K demande/jour

Utilisation des agents/outils

$216.00/ mois

3K en entrée · 1,5K en sortie · 8K demande/jour

Estimez votre coût →

Idéal pour

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

À propos de llama-3.3-nemotron-super-49b-v1.5

Questions fréquemment posées

Combien coûte llama-3.3-nemotron-super-49b-v1.5 pour 1 million de jetons ?+

À quoi sert llama-3.3-nemotron-super-49b-v1.5 ?+

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

Quelle est la taille de la fenêtre contextuelle de llama-3.3-nemotron-super-49b-v1.5 ?+

Le llama-3.3-nemotron-super-49b-v1.5 est-il moins cher que les autres modèles d’IA ?+

Dans l'ensemble suivi HotON.ai, llama-3.3-nemotron-super-49b-v1.5 est moins cher que 79% des modèles en termes de prix d'entrée et se classe #155 de 535 en termes d'efficacité globale.

Existe-t-il une alternative moins chère au llama-3.3-nemotron-super-49b-v1.5 ?+

Citer ce modèle

Prêt à coller dans des articles, des articles ou des invites d'IA : les prix et la date sont actualisés avec les données en direct.

HotON.ai — llama-3.3-nemotron-super-49b-v1.5 (NVIDIA): $0.10/1M input, $0.40/1M output, as of 2026-05-11. https://hoton.ai/fr/models/nvidia-llama-3-3-nemotron-super-49b-v1-5

llama-3.3-nemotron-super-49b-v1.5

Capacités

Prix ​​au fil du temps

Répartition des prix

Coût mensuel estimé par charge de travail

Position sur le marché

Idéal pour

À propos de llama-3.3-nemotron-super-49b-v1.5

Comparez llama-3.3-nemotron-super-49b-v1.5

Actualités du marché liées

Questions fréquemment posées

Citer ce modèle

Modèles associés

llama-3.3-nemotron-super-49b-v1.5

Capacités

Prix ​​au fil du temps

Répartition des prix

Coût mensuel estimé par charge de travail

Position sur le marché

Idéal pour

À propos de llama-3.3-nemotron-super-49b-v1.5

Comparez llama-3.3-nemotron-super-49b-v1.5

Actualités du marché liées

Questions fréquemment posées

Citer ce modèle

Modèles associés

Prix au fil du temps

Prix au fil du temps