USTexteNVIDIA En direct · mis à jour quotidiennement

nvidia/Nemotron-120B-A12B

Baseten Model APIs

Score d'efficacité

90/100

Prix d'entrée

$0.30/ 1 million de jetons

Prix de sortie

$0.75/ 1 million de jetons

Fenêtre contextuelle

202K

Prix mixte

$0.64/ 1 million de jetons

Coût / tâche

$0.001

Alerte baisse de prix

Recevez un e-mail lorsque le prix mixte de ce modèle baisse. Aucun compte requis.

Un e-mail par dépôt. Désabonnez-vous à tout moment.

Capacités

Accepte (saisie)

Texte

Produit (sortie)

Texte

Prix au fil du temps

Prix mixte quotidien (1 million de dollars) — enregistré chaque jour, se transforme en tendance au fil du temps.

Répartition des prix

Prix d'entrée

$0.30/ 1 million de jetons

$0.0003 / 1K

Prix de sortie

$0.75/ 1 million de jetons

$0.0008 / 1K

Prix mixte

$0.64/ 1 million de jetons

$0.0006 / 1K

Mélange sortie-entrée typique 3:1, par million de jetons

Prix à partir du 2026-05-11 · Source: baseten_reference_catalog

Coût mensuel estimé par charge de travail

Assistant de discussion

$180.00/ mois

1 000 entrées · 400 sorties · 10 000 demandes/jour

RAG / contexte long

$427.50/ mois

8K en entrée · 600 en sortie · 5K demande/jour

Utilisation des agents/outils

$486.00/ mois

3K en entrée · 1,5K en sortie · 8K demande/jour

Estimez votre coût →

Position sur le marché

Moins cher que 51% des modèles suivis
Contexte plus large que 67% des modèles suivis
Classement d'efficacité: #95 de 535

Idéal pour

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

À propos de nvidia/Nemotron-120B-A12B

Route de l'API du modèle Baseten pour Nemotron Super, ajoutant une rangée de raison longue-contexte NVIDIA avec des champs de tarification de l'API de modèle géré.

nvidia/Nemotron-120B-A12B est un modèle Texte de Baseten Model APIs (US). HotON.ai le suit à $0.30 par 1 million de jetons d'entrée et $0.75 par 1 million de jetons de sortie, avec une fenêtre contextuelle de jeton 202K. Son score d'efficacité composite est de 90/100 avec une estimation de $0.001 par tâche réussie.

Comparez nvidia/Nemotron-120B-A12B

NVIDIA vs QWEN3.6-FLASH NVIDIA vs ACCOUNTS NVIDIA vs SEED-2.0-MINI NVIDIA vs LING-2.6-FLASH

Actualités du marché liées

L'essaim d'agents de Cursor suggère que les modèles moins chers peuvent gérer la plupart des codes lorsque les modèles frontières planifient le travailil y a 3 heures Les nouveaux superpouvoirs de l’IA : concentration et suiviil y a 5 heures La technologie optique mettrait à jour l’IA d’un robot à la voléeil y a 5 heures

Questions fréquemment posées

Combien coûte nvidia/Nemotron-120B-A12B pour 1 million de jetons ?+

nvidia/Nemotron-120B-A12B est suivi à $0.30 par 1 million de jetons d'entrée et à $0.75 par 1 million de jetons de sortie. Une charge de travail typique de 3:1 sortie-entrée se mélange à environ $0.64 pour 1 million de jetons. Les chiffres sont des données de démonstration illustratives.

À quoi sert nvidia/Nemotron-120B-A12B ?+

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

Quelle est la taille de la fenêtre contextuelle de nvidia/Nemotron-120B-A12B ?+

nvidia/Nemotron-120B-A12B prend en charge jusqu'à une fenêtre contextuelle de jeton 202K — suffisamment grande pour des documents longs et des conversations étendues en une seule requête.

Le nvidia/Nemotron-120B-A12B est-il moins cher que les autres modèles d’IA ?+

Dans l'ensemble suivi HotON.ai, nvidia/Nemotron-120B-A12B est moins cher que 51% des modèles en termes de prix d'entrée et se classe #95 de 535 en termes d'efficacité globale.

Existe-t-il une alternative moins chère au nvidia/Nemotron-120B-A12B ?+

Oui — deepseek-v4-flash est une option moins coûteuse à $0.28 par 1 million de jetons de sortie, tout en couvrant des cas d'utilisation similaires de Texte. Comparez-les côte à côte sur HotON.ai.

Citer ce modèle

Prêt à coller dans des articles, des articles ou des invites d'IA : les prix et la date sont actualisés avec les données en direct.

HotON.ai — nvidia/Nemotron-120B-A12B (Baseten Model APIs): $0.30/1M input, $0.75/1M output, as of 2026-05-11. https://hoton.ai/fr/models/baseten-nvidia-nemotron-120b-a12b

Modèles associés

qwen3.6-flash

Qwen

$1.13

accounts/fireworks/models/minimax-m2p5

Le prix est réel (via le catalogue TestKey, mis à jour quotidiennement). La qualité (Arena Elo) est réelle là où le modèle est classé sur LMArena. L’efficacité est un composite modélisé du prix réel et du contexte.

Prix au fil du temps

Prix mixte quotidien (1 million de dollars) — enregistré chaque jour, se transforme en tendance au fil du temps.

Répartition des prix

Prix d'entrée

$0.30/ 1 million de jetons

$0.0003 / 1K

Prix de sortie

$0.75/ 1 million de jetons

$0.0008 / 1K

Prix mixte

$0.64/ 1 million de jetons

$0.0006 / 1K

Mélange sortie-entrée typique 3:1, par million de jetons

Prix à partir du 2026-05-11 · Source: baseten_reference_catalog

Coût mensuel estimé par charge de travail

Assistant de discussion

$180.00/ mois

1 000 entrées · 400 sorties · 10 000 demandes/jour

RAG / contexte long

$427.50/ mois

8K en entrée · 600 en sortie · 5K demande/jour

Utilisation des agents/outils

$486.00/ mois

3K en entrée · 1,5K en sortie · 8K demande/jour

Estimez votre coût →

Idéal pour

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

À propos de nvidia/Nemotron-120B-A12B

Route de l'API du modèle Baseten pour Nemotron Super, ajoutant une rangée de raison longue-contexte NVIDIA avec des champs de tarification de l'API de modèle géré.

Questions fréquemment posées

Combien coûte nvidia/Nemotron-120B-A12B pour 1 million de jetons ?+

À quoi sert nvidia/Nemotron-120B-A12B ?+

Charges de travail de génération de texte, de chat, de synthèse et de contenu à usage général pour lesquelles une large capacité et un faible coût sont les plus importants.

Quelle est la taille de la fenêtre contextuelle de nvidia/Nemotron-120B-A12B ?+

nvidia/Nemotron-120B-A12B prend en charge jusqu'à une fenêtre contextuelle de jeton 202K — suffisamment grande pour des documents longs et des conversations étendues en une seule requête.

Le nvidia/Nemotron-120B-A12B est-il moins cher que les autres modèles d’IA ?+

Dans l'ensemble suivi HotON.ai, nvidia/Nemotron-120B-A12B est moins cher que 51% des modèles en termes de prix d'entrée et se classe #95 de 535 en termes d'efficacité globale.

Existe-t-il une alternative moins chère au nvidia/Nemotron-120B-A12B ?+

Citer ce modèle

Prêt à coller dans des articles, des articles ou des invites d'IA : les prix et la date sont actualisés avec les données en direct.

HotON.ai — nvidia/Nemotron-120B-A12B (Baseten Model APIs): $0.30/1M input, $0.75/1M output, as of 2026-05-11. https://hoton.ai/fr/models/baseten-nvidia-nemotron-120b-a12b

nvidia/Nemotron-120B-A12B

Capacités

Prix ​​au fil du temps

Répartition des prix

Coût mensuel estimé par charge de travail

Position sur le marché

Idéal pour

À propos de nvidia/Nemotron-120B-A12B

Comparez nvidia/Nemotron-120B-A12B

Actualités du marché liées

Questions fréquemment posées

Citer ce modèle

Modèles associés

nvidia/Nemotron-120B-A12B

Capacités

Prix ​​au fil du temps

Répartition des prix

Coût mensuel estimé par charge de travail

Position sur le marché

Idéal pour

À propos de nvidia/Nemotron-120B-A12B

Comparez nvidia/Nemotron-120B-A12B

Actualités du marché liées

Questions fréquemment posées

Citer ce modèle

Modèles associés

Prix au fil du temps

Prix au fil du temps